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(54) Title: POLYPEPTIDES INVOLVED IN THE EXPRESSION OF RESISTANCE TO GLYCOPEPT1DIC ANTIBIOTICS 

(54) litre: POLYPEPTIDES IMPLIQUES DANS L'EXPRESSION DE LA RESISTANCE AUX ANTIBIOTIQUES GLY- 
COPEPTIDIQUES 

VI : GGX GAA GAT GGX TCX TTX CAA GGX 
G C AG C G 

A 

V2 : AAT ACX ATX CCX GGX TTT AC 
C T C 

(57) Abstract C 

Polypeptide composition characterized in that it comprises at least one protein or protein or part thereof chosen from ami- 
no acid sequences identified in the list of sequences by SED ID NO 1 (VanH), SEQ ID NO 2 (VanA), SEQ ID NO 3 (VanX) 
SEQ ID NO 19 (VanC), or any protein or part thereof recognized by the antibodies directed against VanH, VanA, VanX or 
VanC, or protein or part thereof coded by a sequence hybridizing with one of the nucleotide concatenations identified in the list 
of sequences by SEQ ID NO 8, SEQ ID NO 9 or SEQ ID NO 10 or with one of VI or V2 sequences in stringent or slightly strin- 
gent conditions. The invention also concerns nucleotide sequences coding for these polypeptides and their use in the diagnosis of 
resistance to glycopeptides. 

(57)Abrege 

L'invention concerae une composition de polypeptides, caracterisee en ce qu'elle comprend au moins une proteine ou par- 
tie de proteine choisie parmi les sequences d'acides amines identifiees dans la liste des sequences par SED ID NO 1 (VanH), 
SEQ ID NO 2 (VanA), SEQ ID NO 3 (VanX) ou SEQ ID NO 19 (VanC), ou toute proteine ou partie de proteine reconnue par 
les anticorps diriges contre VanH, VanA, VanX ou VanC, ou toute proteine ou partie de proteine codee par une sequence hybri- 
dant avec I'un des enchainements nucleotidiques identifies dans la liste des sequences par SEQ ID NO 8, SEQ ID NO 9 ou SEQ 
ID NO 10 ou avec Tune des sequences VI ou V2 dans des conditions stringentes ou peu stringentes. L'invention concerne egale- 
ment les sequences nucleotidiques codant pour ces polypeptides ainsi que leur utilisation pour le diagnostic a une resistance aux 
glycopeptides. 
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POLYPEPTIDES IMPLIQUES DANS L 'EXPRESSION DE LA 
RESISTANCE AUX ANTIBIOTIQUES GLYCOPEPTIDES . 



L« invention concerne les polypeptides associes a 
1' expression de la resistance a des antibiotiques de la 
famille des glycopeptides , notamment chez des bacteries 
a Gram-positif, en particulier de la famille des cocci 
a Gram-positif. L' invention vise egalement une sequence 
nucleotidique codant pour ces polypeptides. Elle 
concerne aussi 1 'utilisation de ces polypeptides et de 
leur sequence nucleotidique en tant que moyens de 
detection in vitro d'une resistance a des 
glycopeptides. Parmi les cocci a Gram-positif, 
1« invention vise tout particulierement les 
enterocoques, les streptocoques et les staphylocoques 
qui presentent un interet particulier pour la mise en 
oeuvre de 1* invention. 

Les glycopeptides, parmi lesquels la vancomycine 
et la teicoplanine, sont des antibiotiques inhibiteurs 
de la synthese de la paroi bacterienne. Ces 
antibiotiques sont tres utilises pour le traitement des 
infections severes dues a des cocci a Gram-positif 
(enterocoques, streptocoques et staphylocoques), en 
particulier dans les cas d'allergie et de resistance 
aux penicillines. Malgre un long usage clinique de la 
vancomycine, cet antibiotique est reste actif sur la 
quasi totalite des souches jusqu'en 1986, date a 
laquelle ont ete isolees les premieres souches 
resistantes. Depuis, la resistance aux glycopeptides a 
ete detectee par de nombreux microbiologistes en Europe 
et aux Etats Unis, notamment chez des souches isolees 
de malad s immunodeprimes , rendant necessaire une 
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evaluation systematique de la sensibilize des germes en 
milieu hospitalier. 

L'activite des glycopeptides depend de la 
formation d»un complexe entre 1 • antibiotique et les 
precurseurs du peptidoglycane, plus que de 
1 • interaction directe avec des enzymes du metabolisme 
de la paroi cellulaire. En particulier on a constate 
que les glycopeptides se fixent aux residus terminaux 
D-alanyl-D-alanine (D-ala-D-ala) des precurseurs du 
peptidoglycane . 

L * emergence recente d'une resistance aux 
glycopeptides notamment chez des enterocoques , a 
conduit a l'obtention de certains resultats au niveau 
de la connaissance des facteurs conferant cette 
resistance. 

On a par exemple constate dans une souche 
d'enterocoque particuliere, Enteroccus faecium BM4147, 
que le determinant de la resistance aux glycopeptides 
etait localise sur tan plasmide de 34 kb, le plasmide 
PIP816. Ce determinant a ete clone dans E.coli (Brisson 
Noel et al, 1990, Antimicrob Agents Chemother 34, 
924-927) . 

D'apres les resultats obtenus jusgu'a present, la 
resistance aux glycopeptides etait associee avec la 
production d'une proteine de poids moleculaire 
d« environ 40 kDa, la synthese de cette proteine etant 
induite par des concentrations sous-inhibitrices de 
certains glycopeptides comme la vancomycine. 

En realisant une etude plus approfondie de la 
resistance de certaines souches de cocci a Gram-positif 
vis a vis de glycopeptides notamment de la vancomycine 
ou de la teicoplanine, les inventeurs ont constate que 
cette resistance serait liee a 1> expression de 
plusieurs proteines ou polypeptides codes par des 
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sequences genera lenient portees par des plasmides chez 
les souches resistantes. Les nouveaux resultats obtenus 
par les inventeurs permettent en outre de distinguer 
les genes codant pour deux phenotypes de resistance , 
d , une part les souches hautement resistantes aux 
glycopeptides, d 1 autre part des souches resistantes 4 
un bas niveau. 

Par souche resistante a un haut niveau, on entend 
une souche de bact6rie en particulier une souche de 
cocci a Gram-positif pour laquelle les concentrations 
minimales inhibitrices (CMI) de vancomycine et de 
teicoplanine sont respectivement super ieures a 32 et 8 
/xg/ml. Les CMI de la vancomycine vis & vis des souches 
resistantes a bas niveau sont comprises entre 16 et 32 
/ig/ml. Ces souches sont apparemment sensibles a la 
teicoplanine . 

Les inventeurs ont isole et purifie, parmi les 
composants necessaires a 1" expression de la resistance 
aux glycopeptides , une proteine particuliere denommee 
VANA ou VanA pr6sentant une certaine homologie avec des 
D-alanine-D-alanine ligases. VanA est neanmoins 
fonctionnellement distincte des ligases. 

On designera en principe par "van — " une sequence 
de gene et par "Van.,." une sequence d»acides amines. 

L 1 invention concerne des polypeptides ou proteines 
impliques dans I 1 expression d'une resistance a des 
antibiotiques de la famille des glycopeptides et 
notamment a la vancomycine et/ou a la teicoplanine, 
ainsi que les sequences nucleotidiques codant pour de 
tels complexes. 

* L» invention vise egalement des sondes 

/ nucleotidiques utilisables pour la detection d'une 

fi resistance aux glycopeptides, notamment par la reaction 
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de polymerisation en chaine (PCR) , ou par des tests 
faisant intervenir des anticorps. 

L 1 invention concerne une composition de 
polypeptides, caract6ris£e en ce qu'elle comprend au 
moins une protgine ou partie de prot6ine choisie parmi 
les sequences d'acides amines identifiees dans la liste 
des sequences par SED ID NO 1 (VanH) , SEQ ID NO 2 
(VanA) , SEQ ID NO 3 (VanX) ou SEQ ID NO 19 (VanC) , ou 
toute proteine ou partie de protdine reconnue par les 
anticorps diriges contre VanH, VanA, VanX ou VanC, ou 
toute proteine ou partie de prot6ine codee par une 
sequence hybridant avec l'un des enchainements 
nucleotidiques identifies dans la liste des sequences 
par SEQ ID NO 8, SEQ ID NO 9, SEQ ID NO 10 ou SEQ ID NO 
21 ou avec l»une des sequences VI ou V2 suivantes dans 
des conditions stringentes ou peu stringentes : 
VI : GGX 6AA GAT GGX TCX TTX CAA GGX 
G C AG C G 

A 

V2 l AAT ACX ATX OCX GGX TTT AC 
C T C 

C 

Une premiere composition part iculi ere selon 
1* invention impliquee dans l 1 expression de la 
resistance aux glycopeptides est caracterisee en ce 
qu»elle comprend au moins 3 proteines ou toute partie 
de l»une ou plusieurs de ces proteines necessaires pour 
conferer k des bact£ries a Gram-positif , la resistance 
a des antibiotiques de la famille des glycopeptides, 
notamment a la vancomycine et/ou a la teicoplanine, ou 
de favoriser cette resistance, en particulier dans des 
souches de la famille des cocci a Gram-positif, ces 
proteines ou parties de proteines etant 
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a) reconnues par des anticorps diriges contre l'une 
des sequences identifiees dans la liste des 
sequences par SEQ ID NO 1, SEQ ID NO 2, SEQ ID NO 

1 3, 

b) soit codees par des genes comportant une sequence 
identifiee par SEQ ID NO 8, SEQ ID NO 9 ou SEQ ID 
NO 10 ou hybridant avec l'une de ces sequences ou 
sa sequence complementaire, dans des conditions 
stringentes ou peu stringent es ou avec les 
sequences VI ou V2. 

Ces sequences sont encore designees respectivement 
par 0RF3, ORF1 contenant le gene vanH, vanA (ou ORF2) ; 
elles caract£risent les protdines de resistance telles 
qu'obtenues a partir de la souche Enterococcus faecium 
BM4147 decrite par Leclerq et al (N Engl J Hed 
319:157-161) . 

Une autre proteine, VanC, apparentee a des D-Ala- 
D-Ala ligases mais de specificite differente a ete 
caracterisde chez Enterococcus qa 1 1 inarum BM4173 ; le 
gene vanC presente des domaines ayant une homologie 
suffisante avec le gene vanA, pour que des sondes 
correspondant a des regions determinees de vanA 
permettent sa detection. 

E> gall inarum est un isolat resistant de fa^on 
constitutive a de faibles niveaux de vancomycine 
(Dutka-Malen et al, Antimicrob. Agents Chemother 34 
(1990b) 1875-1879) • 

Par l 1 expression "polypeptides" on entend tout 
enchainement d'acides canines pouvant contenir des 
proteines, ou d'une taille inferieure a celle d»une 
a prot6ine. 

Les conditions de stringence dont il est question 
?* ci-dessus sont determinees selon les modal ites 

habituelles s'agissant de 1 'hybridation de sequences 
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nucleotidiques. A titre d'exemple, s'agissant des 
sequences hybridant avec la sequence du gene vanA (SEQ 
ID NO 8) on pourra appliquer les conditions suivantes : 

pour une hybridation dans de conditions de forte 

stringence : 

* temperature de la reaction 65 'C pendant une nuit 
dans une solution contenant 0,1% de SDS, 0,7% de 
lait en poudre ecreme, 6xSSC (lxSSC=0,i5M NaCl et 
0,015M de citrate de sodium a pH=7,0) 

* lavages a 65 *C dans 2xssc-0,l% SDS ; 

pour une hybridation dans des conditions peu 
stringentes, la temperature d 'hybridation est 60 *C 
pendant une nuit et la temperature des lavages 
45'C. 

L' expression d'une resistance a des glycopeptides 
peut se traduire par la persistance d'une infection due 
a des germes habitue llement sensibles aux 
glycopeptides. 

Un polypeptide ou une proteine est necessaire a 
1' expression d'une resistance aux glycopeptides, des 
lors que son absence rend la souche qui contient ce 
polypeptide ou cette proteine, plus sensible aux 
glycopeptides et que ce polypeptide ou proteine n'est 
pas present chez les souches sensibles. 

Differents niveaux de resistance aux glycopeptides 
existent parmi les souches de cocci a Gram-posit if 
notamment. 

Selon un mode de realisation prefere de 
1' invention, les polypeptides entrant dans la 
composition ci-dessus definie, correspond a 
1 'association des proteines indentifiees dans la liste 
des sequences par SEQ ID NO 1 (VanH) , SEQ ID NO 2 
(VanA) , SEQ ID NO 3 (VanX) . 
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Les inventeurs ont done constate que 1' expression 
d'une resistance aux glycopeptides chez des bacteries a 
Gram-positif, necessite 1* expression d'au moins trois 
proteines ou de polypeptides issus de ces proteines. 

Selon un premier mode de realisation particulier 
de 1' invention, les polypeptides de la composition sont 
encore caracterises en ce que les sequences d'acides 
amines necessaires a 1» expression de la resistance a 
des antibiotiques de la famille des glycopeptides sont 
sous le controle d« elements de regulation, notamment 
des proteines correspondant aux sequences designees par 
SEQ ID NO 4 ou SEQ ID NO 5 dans la liste des 
sequences, et qui correspondent respectivement a une 
sequence R de regulation, et a une sequence S senseur. 

Vans et VanR constituent un systeme de regulation 
a deux composants, VanR etant un activateur de 
transcription et Vans stimulant la transcription 
dependante de VanR. VanS est susceptible de moduler le 
niveau de phosphorylation de VanR en reponse a la 
vancoroycine presente dans le milieu externe et 
intervient ainsi dans le contrdle de la transcription 
des genes a resistance a la vancomycine. 

Ces sequences de regulation sont notamment 
capables d'augmenter le niveau de resistance, dans la 
mesure ou elles favorisent 1» expression des proteines 
de resistance comprises dans les polypeptides de 
1* invent ion. 

Selon un autre mode de realisation avantageux de 
1' invention, les polypeptides de la composition ci- 
dessus sont codes par la sequence SEQ ID NO 6 
identifiee dans la liste des sequences, qui represente 
la sequence codante des 5 proteines decrites 
pr ec6demment . 
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Une autre sequence selon 1« invention est designee 
par SEQ ID NO 11 qui contient la sequence SEQ ID NO 6 
ainsi qu'un enchainement en amont de SEQ id NO 6 codant 
pour une transposase (codee par le brin (-) de la 
sequence, et un enchainement en aval de SEQ id no 6 
correspondant a des genes vanY et vanZ et a chague 
extremite, des seguences inversees repetees de 38 pb. 
SEQ ID no 11 constitue un transposon dont les genes 
interviennent a des niveaux differents dans 
l'etablissement de la resistance aux glycopeptides . 

L' invention vise egalement les ' proteines 
purxfiees appartenant a la composition et aux 
polypeptides decrits precedemment . En particulier 
1- invention vise la proteine purifiee VanA, 

caracterisee en ce qu'elle correspond a la sequence 
d- acides amines SEQ ID NO 2 dans la liste des seguences 
ou une proteine VanC, codee par un gene capable 
d'hybrider avec le gene vanA. 

La proteine VanA comporte 343 acides amines et a 
une masse moleculaire calculee de 37400 Da. La proteine 
Vane comporte 343 acides amines et a une masse 
moleculaire calculee de 37504 Da. 

D'autres proteines interessantes dans le cadre de 
1' invention correspondent aux seguences identifies 
par SEQ ID NO 1 (VanH) , SEQ ID NO 3 (VanX) , SEQ ID NO 4 
(VanR), SEQ ID NO 5 (VanS) dans la liste des seguences. 

La seguence indentifiee par 1 • abreviation SEQ ID 
NO 1 contient la proteine VanH codee par le gene vanH 
cette proteine comporte 322 acides amines et commence 
par une methionine. Cette proteine est une enzyme 
impliquee la synthese du peptidoglycane et a une masse 
moleculaire de 35 , 754 kDa. VanH presente certaines 
Similitudes avec des dehydrogenases qui catalysent 
l'oxydation dependante de NAD* des acides 2-hydroxy- 
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carboxyliques pour form r les acides 2-keto- 
carboxyliqu s correspondants . En fait la proteine VanH 
pourrait mettre en oeuvre le NADP* plutot que le NAD*. 
Isa. proteine VanH contient egalement plusieurs residus 
de sites reactifs qui participent probablement 
directement dans la liaison du substrat et a la 
catalyse. VanH serait impliquee dans la synthese d'un 
substrat de la ligase VanA. Ce substrat de VanA serait 
un acide D-a-hydroxy-carboxylique, qui serait condense 
par VanA avec la D-alanine a la place d'un acide amine 
D, ce qui affecterait la liaison du precurseur du 
peptidoglycane, avec la vancomycine, par perte d'une 
liaison hydrogene parce que l'une des liaisons 
hydrogene formees entre la vancomycine et le N-acetyl- 
D-Ala-D-Ala est realisee avec le groupement NH du 
residu D-alanine-terminal . Rappelons que "Ala" est 
l'abreviation de "alanine". 

Les inventeurs ont pu mettre en evidence certaines 
interactions entre les proteines VanA et VanH et ont pu 
notamment deer ire ceci : la nature de la proteine VanA 
(ligase D-alanine: D-alanine de specif icite alteree pour 
son substrat) qui a permis la resistance a des 
glycopeptides implique la biosynthese d«un nouveau 
compose different de D-Ala-D-Ala par VanA, peptide qui 
peut etre incorpore aux peptidoglycanes mais n'est pas 
reconnu par la vancomycine. En particulier 
1» observation des similitudes entre le produit du gene 
vanH avec les o-ceto-acides reductases D specif iques a 
permis de determiner que ce compose pouvait ne pas etre 
un acide amine D mais un acide hydroxy D, qui lorsqu'il 
etait lie avec la D-alanine par VanH pouvait generer un 
nouveau depsipeptide precurseur du peptidoglycane. 

L' invention vise aussi toute combinaison de ces 
different s protein s dans un complexe de resistance, 
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ainsi que des proteines hybrides comprenant une ou 
plusieurs des proteines ci-dessus, ou partie de ces 
proteines, en association avec une sequence d'acides 
amines determinee. 

Entrent egalement dans le cadre de 1* invent ion, 
les sequences nucleotidiques codant pour l'une des 
sequences d'acides amines decrites ci-dessus. 

Une sequence particuliere est la sequence 
nucleotidique de 7,3 kb environ, correspondant au 
fragment de restriction Hindi II -EcpRl , tel qu'obtenu a 
partir du plasmide pIP816 decrit dans la publication de 
Leclercq et al - 1988, precitee. 

Cette sequence de 7,3 kb comprend 1 • enchainement 
nucleotidique codant pour les 3 proteines de resistance 
et les 2 proteines de regulation dont il est question 
ci-dessus. cette sequence codante est indue dans un 
fragment interne Bglll-jfcai. Elle comprend aussi une 
partie des sequences codantes de la transposase et de 
la resolvase. 

L» invention vise aussi tout fragment nucleotidique 
comprenant le susdit fragment de restriction ainsi que 
toute partie du fragment Hindlll-EcoRl , en particulier 
le fragment de 3,4 kb environ EcoRI-Xbai codant pour 
les 3 proteines de resistance ou le fragment de 1,7 kb 
environ EcoRV-Sacii codant pour VanA ou encore le 
fragment de 3,3 kb environ Hindlll-EcoRI codant pour 
les 2 proteines de regulation VanR et Vans. 

Une autre definition d'une sequence nucleotidique 
de 1' invention correspond a un fragment nucleotidique 
comportant dans l'ordre les sites de restriction 
suivants, tel qu'obtenu a partir de pIP816 precite : 
Hindlll, BglH, Bglll, EcoRl, BamHl, xbal. EcoRl 

Une autre sequence nucleotidique selon 1' invention 
est caracterisee en ce qu'elle correspond $ 



r, 
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l 1 enchainement choisi parmi les sequences identifiees 
par SEQ ID NO 7, SEQ ID NO 6, SEQ ID NO 11 ou SEQ ID NO 
22 , ou en ce quelle comprend cet enchainement ou 
toute partie de cet enchainement, ou encore tout 
enchainement ou partie d 1 enchalnement d*ADN 
complementaire ou tout enchainement d'ARN correspondant 
a l ( unde ces ADN, susceptible, 

- soit de constituer une sonde d' hybridation pour la 
detection d ! une resistance a des antibiotiques de la 
famille des glycopeptides, notamment a la vancomycine 
et/ou a la teicoplanine, en particulier dans des 
souches de la famille des cocci a Gram-positif , 

- soit de coder pour une sequence necessaire ou 
associee a 1» expression de la resistance a des 
antibiotiques de la famille des glycopeptides, 
notamment la vancomycine et/ou la teicoplanine, en 
particulier dans des souches de la famille des cocci a 
Gram-positif . 

La sequence SEQ ID NO 7 code pour les 3 proteines 
de resistance VanH, VanA et VanX. 

La sequence SEQ ID NO 22 et la sequence SEQ ID NO 
11 cbmprennent un transposon represents a la figure 7a; 
ce transposon contient les genes necessaires a 
l 1 expression de la resistance aux glycopeptides, ainsi 
que les gfenes associes £ cette resistance impliques par 
exemple dans la regulation de 1» expression des genes 
necessaires pour obtenir le phenotype de resistance ou 
impliques dans la quant ite de polypeptide de resistance 
obtenue. 

Une sequence particuliere repcndant a la 
definition ci-dessus est l f une des sequences 
suivantes : 
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VI : GGX GAA GAT GGX TCX TTX CAA GGX 
G C AG C G 

A 

f 

OU 

V2 : AAT ACX ATX CCX GGX TTT AC 
C T C 

C 

VI et V2 permettent la constitution de sondes le 
cas echeant en association avec d'autres nucleotides, 
selon le degre de specificite recherche pour detecter 
vanA et vanC et peuvent aussi etre utilisees come 
amorces dans des reactions de polymerisation en chaine. 

D'autres enchainements nucleotidiques pref^res 
sont les enchainements SEQ ID NO 8, SEQ id NO 9, SEQ ID 
NO 10, SEQ ID NO 21, SEQ ID N012 (transposase) , SEQ ID 
NO 13 (resolvase) , SEQ ID NO 14 (vanY) , SEQ ID NO 
15(vanZ) , SEQ ID NO 23 (vanR) , SEQ ID NO 24(vanS) ou 
d'une variante de l'un de ces enchainements des lors 
qu'elle code pour une proteine ayant des proprietes 
immunologiques et/ou fonctionnelles similaires a celles 
des proteines codees par les enchainements SEQ ID NO 8 
SEQ (vanA) , ID NO 9 (vanH) , SEQ ID NO 10 (vanX) , ou SEQ 
ID NO 21(vanC), SEQ ID N012 (transposase) , SEQ ID NO 
13 (resolvase) , SEQ ID NO 14 (vanY) , SEQ ID NO 15(vanZ), 
SEQ ID NO 23(vanR), SEQ ID NO 24(vanS) ou en ce qu'elle 
permet la detection de souches resistantes a des 
antibiotigues de la famille des glycopeptides . 

Des variantes englobent tous les fragments des 
sequences ayant les proprietes suivantes. 

Ces sequences codent pour les proteines de . 
resistance VanH, VanA et VanX. f 

La sequence nucleotidique designee par SEQ ID NO 8 * 
correspond a un fragment d'ADN de 1029 pb situe entre 
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le codon ATG en position 377 et le codon TGA en 
position 1406 sur le plasmide pAT214 (Fig. 6) . 

L' invention vise egalement une sequence 
nucleotidique correspondent a 1 • enchainement SEQ ID NO 
6 correspondant a la sequence codante des 5 proteines 
(2 proteines de regulation et 3 proteines de 
resistance) , et comprenant egalement les sequences 
flanquantes associees a ces sequences codantes, ou 
comprenant cet enchainement. 

Entre aussi dans le cadre de 1' invention une 
sequence modifiee par rapport a SEQ ID NO 6, 
caracterisee en ce qu'elle est depourvue des sequences 
flanquantes. Ces sequences flanquantes sont les 
enchainements representes dans les pages suivantes et 
delimitees comme suit: 

enchainement en amont de la sequence codant pour 
R: entre les bases 1 et 1476 de la sequence de la 
figure 5, 

enchainement entre la sequence codant pour la 
proteine senseur S et ORF1: entre les bases 3347 et 
3500 de la sequence de la figure 5, 

enchainement en aval de la sequence codante 
0RF3: entre les bases 6168 et 7227 de la sequence de la 
figure 5. 

La sequence designee par SEQ ID NO 6 est encore 
caracterisee par le fragment comportant les sites de 
restriction dans l'ordre suivant : 

Bgllll - EcoR I - BamH I - EcoR I 

La localisation des proteines de regulation et de 
resistance est illustree figure 3. 

Les inventeurs ont identifie en amont et en aval 
des genes vanR, vans, vanH, vanA et vanX necessaires ou 
associes a 1' expression de la resistance a des 
glycopeptides a un niveau donne, des genes codant pour 
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une transposase et une resolvase (en amont du groupe 
precite) et des genes vanY et vanZ f en aval de ce 
groupe. Les genes de transposase et de resolvase 
seraient impliques dans des fonctions de transposition 
et le gene vanY codant pour une D,D-carboxy peptidase 
serait implique dans le metabolisme du peptidoglycane, 
et pourrait contribuer a la resistance aux 
glycopeptides chez E. faecium BM4147 meme si vanR, 
vans, vanH, vanA et vanx portes par un plasmide a 
nombre eleve de copies, conferent seuls une resistance 
de haut niveau. 

Notons que la sequence codante de la transposase 
est localisee sur le brin (-) de la sequence ID NO 22 
qui code pour vanR, vans, vanH, vanA, vanX, vanY, vanZ 
et la resolvase. 

L» invention vise non seulement les sequences d'ADN 
identifies dans la liste des sequences mais aussi les 
sequences d'ADN complementaires et les sequences d'ARN 
correspondantes. L» invention concerne en outre les 
sequences equivalentes des precedentes, soit en tenne 
d- expression de proteines, de polypeptides ou de leurs 
fragments decrits plus haut, soit en tenne de capacite 
a detecter, par exemple par les techniques de 
polymerisation en chalne ,des souches de bacteries a 
Gram-positif, presentant une resistance aux 
antibiotiques de la famille des glycopeptides tels que 
la vancomycine ou la teicoplanine. 

Font egalement partie de 1' invention, des 
sequences recombinantes caracterisees en ce qu'elles 
comprennent l'une des sequences nucleotidiques ci- 
dessus . 

L' invention concerne aussi un vecteur recombinant 
caracterise en ce qu'il comprend l'une des sequences 
nucleotidiques ci-dessus, en un site non essentiel pour 
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sa replication, sous le controle d' elements de 
regulation susceptibles d'intervenir dans 1 'expression, 
de la resistance a des antibiotiques de la famille des 
glycopeptides, notamment la vancomycine ou la 
teicoplanine, chez un hdte determine. 

Des vecteurs recombinants particulierement 
avantageux pour la mise en oeuvre de 1« invention sont 
les vecteurs suivants : pAT214 contenant le fragment 
EcoRV-SacII de 1761 bp contenant une sequence 
nucleotidique codant pour la proteine VanA ; dans ces 
vecteurs les sequences de 1» invention sont 
avantageusement placees sous le controle de promoteurs 
tels que le promoteur lac. 

L« invention vise aussi un hdte cellulaire 
recombinant comprenant une sequence nucleotidique telle 
gue decrite precedemment ou un vecteur decrit ci- 
dessus, dans des conditions permettant 1" expression de 
la resistance a des antibiotiques de la famille des 
glycopeptides, notamment la resistance a la vancomycine 
ou/et a la teicoplanine, cet hdte etant par exemple 
choisi parmi les bacteries, notamment les cocci a 

Gr am-pos it i f . 

Pour certaines applications on peut aussi utiliser 
les levures, les champignons, les cellules d'insectes 
ou de mammi feres. 

L' invention vise egalement une sonde nucleotidique 
caracterisee en ce qu'elle est capable d'hybrider avec 
une sequence decrite precedemment, cette sonde etant le 
cas echeant marquee. Ces sondes peuvent etre ou non, 
specifiques des proteines de resistance aux 
« glycopeptides . 

Des marqueurs utilisables pour les besoins de 
!• invention sont les marqueurs radioactifs connus ainsi 
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que d'autres margueurs tels que les marqueurs 
enzymatiques ou des marqueurs chemoluminescents . 

Des sondes ainsi marquees peuvent etre utilisees 
dans des tests d« hybridation pour detecter une 
resistance aux qlycopeptides chez des bacteries a 
Gram-positif. Dans ce cas, on pourra mettre en oeuvre 
des conditions de faible stringence. 

Des sondes nucleotidiques selon 1» invention 
peuvent etre caraeterisees en ce qu'elles sont 
specifigues chez des bacteries a Gram-positif des 
sequences codant pour une proteine de resistance a des 
glycopeptides notamment a la vancomycine et/ou a la 
teicoplanine, ces sondes pouvant en outre etre 
universelles parmi ces sequences. 

Par ces sondes specifigues, on entend tout 
oligonucleotide hybridant avec une seguence 
nucleotidigue codant pour l'une des proteines selon 
1' invention, telle que decrite dans les pages 
precedentes, et ne presentant pas de reaction 
d* hybridation croisee ou d« amplification (PCR) avec des 
seguences presentes chez 1- ensemble des souches 
sensibles. 

Le caractere universel des oligonucleotides 
utilisables en PCR, est determine par leur capacite de 
promouvoir specif iguement 1» amplification d'une 
seguence nucleotidigue impliguee dans la resistance 
chez une souche guelcongue de bacterie a Gram-positif, 
resistante aux antibiotigues de la famille des 
glycopeptides. 

La taille des sondes nucleotidigues selon 
1' invention peut varier en fonction de 1 'utilisation 
recherch^e. Pour les oligonucleotides utilisables en 
PCR on aura recours a des fragments de longueur usuelle 
dans cette technigue. Pour realiser des sondes, on peut 
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prendre toute partie des sequences de 1' invention, par 
exemple des sondes fragments de 200 nucleotides. 

Selon un mode de realisation particulier de 
1» invention, une sonde nucleotidigue est choisie pour 
sa specif icite vis a vis d'une sequence nucleotidigue 
codant pour une proteine necessaire a 1' expression 
chez des bacteries a Gram-positif d'un haut niveau de 
resistance a des antibiotigues de la famille des 
glycopeptides, en particulier a la vancomycine et a la 
teicoplanine. 

A titre d' exemple des sondes interessantes 
pourront etre choisies dans la partie intragenique du 
gene vanA. 

D'autres sondes avantageuses pour la realisation 
de 1' invention, sont caracterisees par leur caractere 
universel, selon la definition precedente, mais non 
specifique des genes de resistance. Elles peuvent etre 
utilisees aussi comme amorces de PCR, et sont par 
exemple : 

VI : GGX GAA GAT GGX TCX TTX CAA GGX 
G C AG C G 

A 

V2 : AAT ACX ATX CCX GGX TTT AC 
C T C 

C 

VI et V2 hybrident avec vanA et vanC et sont 
susceptibles de conduire a la detection chez d'autres 
micro-organismes, de proteines associees a la 
resistance aux glycopeptides. 

D'autres sondes particulieres de 1' invention ont 
le caractere specifique d'une sequence nucleotidigue 
codant pour une proteine necessaire a 1« expression 
chez des bacteries a Gram-positif d'un bas niveau de 
resistance a des antibiotiques de la famille des 
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glycopeptides, en particulier 4 la vancorycine ch z des 
bacteri s a Gram-positif . 

On mentionne egalement que des sondes 
olxgonucleotidiques qui seraient issues de la sequence 
du gene vanA codant pour la proteine VanA peuvent Stre 
utxlxsees pour rechercher indifferemment une resistance 
de haut niveau ou de bas niveau. 

D'une facon particulierement preferee, on 
caracterise une sonde de 1- invention en ce gu'elle 
hybrxde, avec une sequence nucleotidique chromosomigue 
ou non chromosomique d'une souche a Gram-positif 
resxstante a des glycopeptides, notamment la 
vancomycin et/ou la teicoplanine, en particulier en ce 
qu'elle hybride avec une sequence nucleotidique 
chromosomigue ou non chromosomique d'une souche de 
cocci a Gram-positif, par exemple une souche 
d enterocogue et de preference E. f aec j um 4147 ou 
E. aallinaY-»n,. 

Pour differencier des souches a haut niveau de 
resxstance, de souches a bas niveau de resistance on 
pourra realiser un test d'hybridation en mettant en 
oeuvre des conditions de forte stringence. 

Les oligonucleotides de 1' invention peuvent etre 
obtenus a partir des sequences de !• invention, par 
coupure avec des enzymes de restriction, ou par 
synthese chimique selon les methodes classiques 

L- invention vise par ailleurs des anticorps 
polyclonaux ou monoclonaux, caracterises en ce qu'ils 
reconnaissent le ou les polypeptides decrits ci-dessus 
ou une sequence d'acides amines decrite ci-dessus. 

Ces anticorps peuvent etre obtenus selon les 
methodes classiques de production d- anticorps. En 
particulier pour la preparation des anticorps 
monoclonaux on aura recours a la methode de Kolher et 
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Milstein selon laguelle on pr'pare des anticorps 
monoclonaux par fusion cellulaire entre des cellules de 
myelome et des cellules spleniques de souris 
prealablement immunisees avec un polypeptide ou une 
composition selon 1» invention, confonnement au procede 
classique. 

Les anticorps de !• invention sont avantageusement 
utilisables pour la detection de la presence de 
proteines caract£ristigues d f une resistance aux 
glycopeptides, en particulier & la vancomycine et a la 
teicoplanine . 

Des anticorps particulierement interessants sont 
les anticorps polyclonaux ou monoclonaux diriges contre 
la proteine VanA ou VanC. De tels anticorps permettent 
avantageusement de d£tecter des souches de bact^ries, 
en particulier des cocci a Gram-posit if presentant une 
resistance & haut niveau vis a vis des antibiotigues de 
la famille des glycopeptides. lie cas echeant, une £tape 
de lyse prealable des cellules de 1 •echantillon soumis 
a la detection , est mise en oeuvre prealablement a la 
mise en contact de 1 • Echantillon avec les anticorps. 

Pour realiser cette detection , on aura 
avantageusement recours a des anticorps marques par 
exemple par une substance radioactive ou autre. 

Entrent done dans le cadre de 1" invention, des 
tests pour la detection chez les bacteries a Gram- 
positif, d f une resistance aux glycopeptides, notamment 
des tests mettant en oeuvre les techniques ELISA. 

Un kit pour le diagnostic in vitro de la presence 
de souches a Gram-positif , resistantes aux 
glycopeptides, en particulier a la vancomycine et/ou a 
la teicoplanine, ces souches appartenant en particulier 
aux cocci a Gram-positif par exemple des enterocoques, 
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par exemple E. faecium ou E. cyallinarum , caracteris * en 
ce qu'il comprend : 

- des anticorps repondant a la definition ci-dessus, 
le cas 6cheant marques, 

- un reactif pour la detection d'une reaction 
immunologique du type anticorps-antigene, 

- le cas echeant des reactifs pour effectuer la lyse 
de cellules de 1 »6chantillon teste. 

Les moyens mis au point par les inventeurs 
presentent par ailleurs I'avantage tout a fait 
interessant d*etre adaptes pour la realisation d'un 
test ou d»un kit rapide et fiable de detection de 
souches a Gram-positif , resistantes aux glycopeptides 
par la reaction de polymerisation en chaine (PCR) . Un 
tel test permet d'amdliorer la sensibilite des tests 
existants qui restent peu fiables et peut permettre 
dans certains cas la detection de 1 1 ensemble des 
representants de la famille des genes codant pour des 
prot&ines de resistance aux glycopeptides chez des 
bacteries a Gram-positif. 

I*a realisation d'tin test par la methode 
d 1 amplification des genes de ces proteines est faite 
par la technique PCR ou par la technique IPCR (IPCR : 
abreviation de reaction de polymerisation en chaine 
inverse) . 

La technique IPCR permet 1 'amplification des 
regions KH 2 et COOH terminales des genes que l^n 
souhaite detecter. 

Certaines amorces particulieres permettent 
d* amplifier les genes des souches resistantes a bas 
niveau. Ces amorces sont par exemple choisies dans la 
sequence codant pour la proteine de resistance VanA, 

A titre d 1 exemple les sequences suivantes sont 
utilisables comme amorces pour la preparation de sondes 
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pour la detection d'une amplification par la methode 
PCR ou IPCR. 

VI : GGX GAA GAT GGX TCX TTX CAA GGX 
G C AG C G 

A 



( 



i 
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V2 : AAT ACX ATX CCX GGX TTT AC 
C T C 

C 

X represente l'une des bases A,T,C ou G ou encore 
correspond dans tous les cas a l'inosine. 

L' invention vise naturellement les sondes 
complementaires des oligonucleotides precedemment 
decrits ainsi que 6ventuellement les sondes ARN qui 
leur correspondent. 

Un kit pour le diagnostic in vitro de la presence 
de souches de bacteries a Gram-positif, resistantes aux 
glycopeptides, en particulier resistantes a la 
vancomycine et/ou a la teicoplanine , oes souches 
appartenant en particulier aux cocci a Gram-positif, 
notamment en ce qu'il s'agit de souches d « enterocoques , 
par exemple E. faecium ou E. aallinarum . est 
caracterise en ce qu'il comprend : 

une sonde nucleotidique repondant aux definitions 

ci-dessus et le cas echeant, 

des oligonucleosides triphosphates en quantite 

suffisante pour penaettre 1 'amplification de la 

sequence recherchee, 

un tampon d' hybridation, 

un agent de polymerisation d'ADN. 

L» invention vise aussi un procede de detection in 
vitro de la presence de souches a Gram-positif , 
resistantes aux glycopeptides, en particulier a la 
vancomycine et/ou a la teicoplanine, ces souches 
appartenant en particulier a la famille des cocci a 
Gram-positif, notamment en ce qu'il s'agit de souches 
d'enterocoques, par exemple E. faecium ou E.gallinarum . 
caracterise en ce qu'il comprend : 

a) la mise en contact d'un echantillon biologique 
susceptible de contenir les souches resistantes, 
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avec une amorce constitute par une s'quence 
nucleotidique ci-dessus decrite, ou toute partie 
d'une sequence precedemment decrite, capable 
d«hybrider, avec une sequence nucleotidique 
recherchee necessaire a 1' expression de la 
resistance aux glycopeptides, cette sequence etant 
utilisee comme matrice, en presence des 4 
differents nucleosides triphosphates, et d'un 
agent de polymerisation, dans des conditions 
d' hybridation telles que pour chaque sequence 
nucleotidique ayant hybride avec une amorce, un 
produit d« elongation de chaque amorce 
complementaire de la matrice est synthetise, 

b) la separation de la matrice et du produit 
d» elongation obtenu, ce dernier pouvant alors 
egalement se comporter comme une matrice, 

c) la repetition de l»etape a) de facon a obtenir une 
quantite detectable des sequences nucleotidiques 
recherchees, 

d) la detection du produit d' amplification des 
sequences nucleotidiques . 

La detection des produits d« elongation de la 
sequence recherchee peut etre realisee par une sonde 
identique aux amorces mises en oeuvre pour ef fectuer la 
technique PCR ou IPCR, ou encore par une sonde 
differente de ces amorces, cette sonde etant le cas 
echeant marquee. 

Des details concernant la mise en oeuvre des 
techniques PCR, peuvent etre obtenus a partir des 
demandes de brevets EP 0229701 et EP 02003 62. 

D'autres avantages et caracteristiques de 
1» invention apparaissent dans les exemples qui suivent 
et dans les figures. 



BNSDOCID- <WO 9207942A1 I > 



WO 92/07942 _ 

PCT/FR91/00855 



24 

FIGURES 

- Figure 1 : electrophorese sur gel de polyacrylamide 
SDS (SDS-PAGE) des proteines des fractions membranaires 
lxgnes 1 et 4, standards de poids moleculaires ; ligne 
2, E. faecium BM4147 mis en culture en !• absence de 
vancomycine; ligne 3, BM4147 mis en culture avec 10 ft 
g/ml de vancomycine. La tete de fleche indique la 
position de la proteine VAN A. 

- Figure 2 : 

A : cartes de restriction des inserats des plasmides 
PAT213 et pAT214. Le vecteur et 1-inserat d'ADN sent 
distmgues par des segments clairs et sombres 
respectivement. La fleche ouverte represente le gene 
vanA. * 

B : Strategie pour le seguengage nucleotidique pour 
1 xnserat de 1761 bp dans le plasmide P AT214. Les 
f leches indiguent la direction et 1-etendue des 
reactions de sequengage par la methode dideoxy. 
L * amorce synthetigue d» oligonucleotides 

(5- ATGCTCCTGTCTCCTTTC 3- OH) est complement a ire de la 
sequence entre les positions 361 et 378. Seuls les 
sites de restriction pertinents sent donnes. 

- Figure 3 : position des sequences R,S,ORFl f ORF2,ORF3. 

- Figure 4 : representation de SEQ id no 6 

- Figure 5 : representation de SEQ id no 6 et de la 
proteine correspondante. 

- Figure 6 : sequence du gene vanA et la proteine 
correspondante. 
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- Figure 7 : 

(a) : Localisation des g'nes vanR, vans, vanH, vanA, 
vanX, vanY, vanZ, du gene de la transposase et du gene 
de la resolvase, ainsi que des sequences terminales 
inversees repetees de 38 bp a l'extremite du 
transposon . 

(b) : Cartographie des plasmides (A) Polyl inker d 
pAT29 et des derives constructs dans cette etude. La 
fleche marquee P2 indique la position et 1 • orientation 
du promoteur P2 de aphA-3 (Caillaud et al, 1987, Mol. 
Gen. Genet. 207:509-513). (B) Inserat de pAT80. Les 
rectangles blancs indiquent l'ADN de pAT29 mais ne sont 
pas representes a l'echelle. Les rectangles se 
terminant par une fleche indiquent les sequences 
codantes. Les f leches en traits pleins, verticales et 
horizontales indiquent respectivement la position et 
1 • orientation du gene apha-1 dans les derives de pAT80. 
Sites de rstriction : Ac, Acc I ; B, BamHI ; Bg, Bglll ; 
Bs, BssHII ; E, EcoRI ; H, Hindlll ; He, Hindi ; K, 
Kpn l ; P, PstI i S, Sma l ; SI, SacI, SIX, SacII ? Sa, 
Sai l ; Sp, Sph I ; Xb, Xbal. (C) Inserats dans pAT86, 
pAT87, pAT88 et pAT89. Les inserats sont representes 
par des traits pleins et les vecteurs correspondents 
sont indiques entre parentheses. 

_ Figure 8 : sequence hucleotidique du transposon 
represente a la figure 7 et sequence d'acides amines 
des proteines correspondantes . La sequence 
nucleotidique est presentee pour le brin (+) et pour le 
brin (-) ( correspondant a la sequence complementaire du 
brin (+) des positions 1 a 3189) sur lequel est 
localisee la sequence codante de la transposase. 
- Figure 9 : sequence nucleotidique du fragment de 
1347 bp SacI -PstI du plasmide pAT216 contenant le gene 
vanC. La numerotation comm nee a la premiere base G du 



BNSOOCID: <WO 9207942A1 I > 



FEUILLE DE REWPI-ACEWIEI«T 



WO 92/07942 



PCT/FR91/00855 



26 

site de restriction Sad . La sequence RES potentielle 
en amont du codon d' initiation de traduction ATG a la 
position 215 est soulignee. Le codon STOP (TGA) est 
indigue par *. La region codante de vanC et la sequence * 
d'acides amines deduite sont indiquees en caracteres 
gras. Des clones sequent iels se chevauchant ont ete * 
• generes par des fragments de restriction de sous- 
clonage de pAT216 dans le bacteriophage M13mpl0 
(Amersham, Angleterre). L» amorce universelle (New 
England Biolabs Beverly MA) a ete utilisee pour 
sequencer l'inserat des phages recombinants. Le 
sequencage a ete realise par la methode enzymatique de 
di-desoxy nucleotide (Sanger et al, 1977 PNAS 74: 
5463-5467) en utilisant la polymerase d'ADN T7 
(Sequenase US B CORP, Cleveland, OH) et le [cr- 35 S]dATP 
(Amersham, England) . Les produits des reactions ont ete 
charges sur des gels de polyacrylamide denaturant a 6%. 

- Figure 10 : alignement des sequences d'acides amines 
de VanC, VanA, DdlA et DdlB. Les acides amines 
identiques (I) et les substitutions conservatives (C) 
dans les 4 sequences sont indiques dans 1 'alignement. 
Pour classifier les substitutions conservatives, les 
acides amines ont ete groupes comme suit : RK, LFPMVI, 
STQNC, AGW, H, ED et Y. Les regions de forte homologie 
correspondant aux domaines 1, 2, 3 et 4 sont 
soulignees. Les sequences correspondant aux peptides l 
et 2 sont indiquees par les f leches. 

- Figure 11 : description des oligonucleotides VI et V2 
(A) : Sequence d'acides amines des peptides 1 et 2 de 

VanA et des D-Ala-D-Ala ligases. Le nombre d'acides « 
amines entre l'extremite N-terminale et le peptide 1, 
entre les peptides 1 et 2 et le peptide 2 et 
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1* extremity C-terminale est indique. Les acides amines 
identiques entre au moins 2 des 3 sequences, sont 
representes en caractferes gras. 

(B) : Peptides cible et sequence nucieotidique deduite. 
X repr6sente une base quelconque de l'ADN. Le peptide 2 
dans DdlB difffere du peptide cible au niveau de 2 
positions (*) • 

(C) : Sequence nucl6otidique de VI et de V2. Des 
nucleotides alternds et la d^oxyinosine (I) qui peuvent 
correspondre h toute base d 1 ADN, ont ete utilises aux 
positions pour lesquelles les sequences nucleotidiques 
codant pour les peptides cible varient. Les f leches 
donnent la direction de la synthese d 1 ADN • Les 
oligonucleotides ont 6t6 synthetises par la methode au 
methoxy-phospharamidite avec un appareil Biosystem ADN 
380B (Applied Biosystem, Poster City, Ca) • L' ADN a 6t6 
isole a partir de lysats bacteriens par extraction avec 
le bromure d'hexadecyl trim6thyl ammonium (Inst. 
Biotechnologies, Inc, New Haven, CO) (Le Bouguenec et 
al, 1990, J. Bacteriol. 172 :727-734) et utilise comme 
matrice pour 1 'amplification par PCR avec un systeme de 
chauffage controls "Intelligent Heating Block" IBH101 
(Hybarid ltd, GB) , selon la description de Mabilat et 
al (1990, Plasmid 23:27-34). Les produits 
d 1 amplification ont ete r£veles par electrophorese sur 
gel a 0,8%, apres coloration au bromure d»ethidium. 

- Ficrure 12 : inactivation par insertion de vanC. Le 
gene vanC est represents par une fleche ouverte et le 
fragment interne de 690 bp EcoRI-HinCII est hachure. En 
trait fin on a represents 1 'ADN de pAT114 ; en trait 
gras I 1 ADN chromosomigue de PM4174 ; les f leches 
indiquent les genes de resistance aux antibiotiques : 
aphA-3 est le gene codant pour la 3 '-aminoglycoside 
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phosphotransferase ; era est le gene codant pour la ER* 
methyl transferase. 

(A) : Le plasmide pAT217 a ete construit par ligature 
du fragment EcoRl-Hincil de pAT216 avec le vecteur 
suicide PAT114 (Trieu-Cuot et al, 1991, Gene 106:21-27) 
digere avec EcoR I et Smal. 

(B) : Region vanC de l'ADN chromosomique de BM4174. 

(C) : Region vanC apres integration de pAT2l7. 

- Figure 13 : analyse Southern blot de 1 • integration de 
PAT217 dans le gene vanC de BM4174. 

(partie gauche) : ADN total de BM4175 (ligne 2) et 
BM4174 (ligne 3) digere avec EcoRI et resolu par 
electrophorese sur gel d'agarose a 1%. L'ADN du 
bacteriophage lambda digere avec Psti a ete utilise 
comme standard de masse moleculaire (ligne 1) . L'ADN a 
6te transfere sous vide sur une membrane Nytran 
(Schleicher et Schul, Allemagne) en utilisant un 
appareil Trans-Vac TE80 (Hofer Scientific Instruments, 
San Francisco, CA) et lie a la membrane par 
l'xntermediaire d'une lumiere UV. L'hybridation a ete 
realisee avec la sonde c (Middle) ou la sonde aphA-3 
specifique de pAT114 (Lambert et al, 1985, Annales de 
l'Institut Pasteur/Microbiol. 136(b): 135-150). 
^partie droite) : les sondes ont ete marquees avec le 

P par translation de coupure. Les masses moleculaires 
(kb) sont indiquees. 

- Figure 14 : alignement des sequences d'acides amines 
deduites de Vans a partir de E. faecium BM4147 et de 
PhoR et Envz de E.coli. Les nombres sur la gauche se 
referent a la position du premier acide amine dans 
1' alignement. Les nombres sur la droite se referent a 
la position du dernier acide amine de la ligne 
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correspondante. Les acides amines identiques sont 
encadres. Les pointilles indiquent des trous introduits 
pour optimiser la similitude. Les traits indiquent les 
positions des motifs conserves d' acides amines dans 
d'autres HPK. Les rdsidus histidine en gras dans le 
motif 1 sont des sites potentiels d»aut ©phosphory- 
lation* 

- Figure 15 : alignement des sequences d' acides amines 
deduites de VanR de E . f aecium BM4147, OmpR et PhoB de 
E.coli ainsi que de CheY de Salmonella typhimurium . Les 
nombres sur la droite indiquent la position du dernier 
acide amine de la ligne correspondante. Les acides 
amines indentiques sont encadres. Les pointilles 
indiquent les trous introduits pour optimiser les 
similitudes. Les residus en caractere gras 
correspondent aux acides amines fortement conserves 
dans les domaines effecteurs, d'autres RR. Le rdsidu 
aspartique 57 de CheY est phosphoryle par la HPK 
associee CheA. 
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I - IDENTIFICATION DE VanA 

Materiels et methodes pour 1 ' indentif ication et la 
caracterisation du gene vanA 



Souches hacteriennes et plasmides 

L« origins des plasmides utilises est donnee dans 
le tableau ci-apres. 



Souche ou plasmide 

Escherichia Coli 

JM83 

AR1062 

JH103 

ST640 

Enter ococcus faeciiiw 
BM4147 

Plasmide pUC18 

pAT2»13 

PAT214 



Source ou Reference 



Messing (1979) 

Rambach et Hogness (1977) 

Hannshan (1983) 

Lugtenberg et van Schijndel 

van-Dam (1973) 



Leclercq et al (1988) 
Norrander et al (1983) 
Brisson-Noel et al (1990) 
Decrit dans ce texte 



Preparation des membranes d 1 enterocooue 

Enteroc occus faecium BM4147 a ete cultive jusgu'a 
l'obtention d'une densite optique (DO^) de 0 # 7 dans 
500ml de bouillon coeur-cervelle (milieu broth BHI) . 
L« induction a ete realisee avec 10 fig/ml de vancomycine 
(Eli Lilly Indianapolis Ind) . Les etapes ulterieures 
ont ete realisees a 4*C. Les cellules ont ete 
recuperees par centrifugation pendant 10 minutes a 
6000g r lavees dans un tampon TE (0,01 M TRIS-HC1, 0,002 
M EDTA, pH 7,0) et lysees avec des billes de verre (100 
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de diametre) dans un appareil Braun pendant: 2 
minutes. Les debris cellulaires ont ete s 'pares par 
centrifugation pendant 10 minutes a 6000g. Les 

? membranes ont 6t6 collect6es par centrifugation pendant 

1 heure a 65000g et resuspendues dans 0,5ml de tampon 

> TE. 

Preparation des minicellules 

Des plasmides ont ete introduits par 
transformation dans la souche E.coli AR1062 preparee 
sous forme de sac bact£rien. Les sacs bacteriens ont 
ete recuperes sur des gradients de sucrose et les 
proteines ont 6td marquees avec 50 jiCi de [ 35 S]L- 
methionine (Amersham, Grande-Bretagne) selon la methode 
de Rambach et Hogness (1977, P.N.A.S. USA, 74; 
5041-5045) . 

Preparation des fractions membranaires et des 
fractions cytoplasmigues de E.coli 

E.coli JM83 et des souches derivees ont ete mises 
en culture dans un milieu BHI jusqu'a l^btention d*une 
density optique (DO^q) de 0,7, lavees et suspendues 
dans un tampon TE* La suspension cellulaire a ete 
traitee par ultrasons (phonolysee) pendant 20 secondes 
avec des doses de 50 W dans un appareil de 
fragmentation de cellules dans un appareil a ultrasons 
Branson B7 et les cellules intactes ont ete eliminees 
par centrifugation pendant 10 minutes a 6000g. Le 

* surnageant a ete fractionne en fractions membranaire et 
cytoplasmigue par centrifugation pendant 1 heure a 

* 100000g. 
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Electrophorese sur gel de polvacrvlamide sds 

(SDS-PAGEY 

Les proteines des fractions bacteriennes ont ete 
separees par SDS-PAGE dans des gels a gradient lineaire 
de polyacrylamide (7,5% - 15%) (Laemmli 1970, Nature 
227 : 680-685). L ' electrophorese a ete realisee pendant 
1 heure a 200 V puis 3 heures a 350 V. Les gels ont ete 
colores avec du bleu de Coomassie. Les proteines des 
extraits ont ete separees dans des gels de 10% de 
polyacrylamide et visualisees par autoradiographie . 



Purification de la bande protejque et 
determinat ion de la sequence N-terminale 

Les proteines des fractions membranaires d»une 
culture induite de E.faecium BM4147 ont ete separees 
par SDS-PAGE. Le gel a ete electrotransfere pendant l 
heure a 200 mA sur une membrane de polyvinyl idene 
difluorure (Immobilon Transfer, Millipore) en utilisant 
un appareil de transfert (Electrophoresis Unit LKB 2117 
Multiphor II) selon les recommendations du fabricant. 
Les proteines transferees ont ete colorees avec le 
rouge de Ponceau. La portion de membrane portant la 
proteine interessante a ete coupee, centree sur un 
filtre en teflon et placee dans la cartouche du bloc 
d'un sequenceur (Sequenceur Applied Biosystems modele 
470A). La proteine a ete sequencee par la degradation 
automatisee de Edman (1967, Eur. J.Biochem 1; 80-81). 

Construction de plasmides 

Le plasmide pAT2l3 (Brisson-Noel et al, 1990, 
Antimicrob Agents Chemother, 34; 924-927) consiste en 
un fragment d'ADN EcoRl de 4,0 kb du plasmide plP816 
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d'enterocoque clone au site EcoRI d'un vecteur navette 
gram-positif-gram-negatif P AT187 (Trieu-Cuot et al, 
1987, FEMS Microbiol Lett 48; 289-294). Pour construire 
PAT214, le fragment d'ADN de 1761 bp EcoRV-SacII de 
PAT213 a ete purifie, traite avec le fragment de Klenow 
de 1-ADN polymerase I de E.coli et ligue a 1'ADN de 
PUC18 prealablement digere avec Smal et dephosphoryle 
(figure 2). Le clonage (Maniatis et al, 1982 Cold 
Spring Harbor Laboratory Press) a ete realise avec des 
endonucleases de restriction (Boehringer Mannheim et 
Pharmacia) avec la ligase ADN T4 (Pharmacia) et la 
phosphatase alcaline (Pharmacia) selon les 
recommandations du fabricant. 

o „i„n aa » dans M13 et seouencp nucleotidique 

Les fragments d'ADN de restriction ont ete sous- 
clones dans le polylinker des formes de replication des 
derives mpl8 et mpl9 du bacteriophage M13 (Norrander et 
al, 1983, Gene 26; 101-106), obtenus aupres de 
Pharmacia P-L Biochemicals . E^coli JM103 a ete 
transfecte avec des phages recombinants et de 1 ADN 
simple brin a ete prepare. Le sequengage nucleotidxgue 
a ete realise par la methode enzymatique des di-desoxy 
nucleotides (Sanger et al, 1977, P.N.A.S USA 74; 
5463-5467) en utilisant une ADN T7 polymerase 
(Sequenase, United States Biochemical Corporatxon, 
Cleveland Ohio) et de l'[<r*S]dATP (Amersham, Grande- 
Bret agne) . Les produits des reactions ont ete reveles 
dans des gels de polyacryl amide contenant un tampon 
denaturant a 6%. 
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analyse informal, et ,i. n n e e s ..^ . 

utUisant les pro^ammes d'ordinateur DBCOMP et DBUTIL 
(Staden, 1980, Nucleic Acids Res 8; 3673-3694). La 
bangue de dcnndes de proteines, P SEQI p de !. Instltut 
Pasteur a ete criblee en utllisant un alogorytbme 
developpe par claverie (1984, Nucleic Acids ReTlT 
397-407). Les alignemente entre des paires de sequences 

t lZZ*?T mt 4ti constrults « 

726 730) La signification statistigue de 1-homologie a 

U985 St"" aVS ° 1,al ™~ - et Pearson 

(1985, Science 227; 1435-1440). 

Pour chague comparison 20 sequences d-acides 
amines ont .te utilisees pour calculer les doyennes et 
les deviations standard des resultats aleatoires 



Tests de c n . r ^ mentatinr , ^ „^ <T ._ 

tr,„ s f S * PlaSlnl<Jes ont ete introduits par 

rCeratu 0 " ^ ^ — *^ * 

la temperature avec une ligase non modiride D-ala-D-ala 

(Lugtenber, et al 1973, J. Bacterid no, 26 -34, 

transformants ont fit* .at. .. ■ - 

ont ete selectionnes . 30 -c sur des 

Plagues contenant 100 W /ml d'ampicilline et la 
et leT * PlaSni «^ * e la taill. recnerchee 

colon! restriction ont ete verifies. Des 

colonies unigues poussees A 3o-c dans un milieu BHI 
broth contenant da Lampicilline ont ete placees » la 
**» sur un „ili e u agar BHI contenant 100 , g/m l 
d" ampicilline et dans bo ..m *,i 

„,„. . aans 50 a 'lsopropyle-l-tl>io-8-D- 

glacto-pyranoside ( IPTC) et les es ' 

incubees , une temperature permissive de 30-c ou non 
permissive de 42-c t. «-..,- ., 

42 c. Le test de complementation etait 
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consider' comme positif si les colonies etaient 
present s apres 18 h ures d' incubation a 42 °C. 



RESULTATS 

-ratification de la prot eine VanA et sequence N- 
terminale 

Les fractions membranaires des E. faecium BM4147 
mis en culture d'une part dans des conditions 
d' induction, et d« autre part en 1« absence d' induction, 
ont ete analysees par SDS-PAGE. La seule difference 
detectable associee avec 1« exposition a des 
concentrations sous-inhibitrices de vancomycine a ete 
1 • intensification marquee d'une bande qui correspondait 
a une proteine de poids moleculaire estime d» environ 40 
kDa. Dans les cellules induites et dans les cellules 
non induites, la bande proteique represente la meme 
proteine puisque cette bande est absente des membranes 
d'un derive de BM4147 qui a perdu le plasmide pIP816. 
La proteine inductible, designee par VanA a ete 
purifiee apres SDS-PAGE et une degradation automatisee 
de Edman a ete realisee sur un echantillon de 50 pmol. 
Neuf acides amines de la sequence N-terminale de VanA 
ont ete identifies : Met Asn Arg lie Lys Val Ala lie 
Leu. 

sous-clonaae du g ene vanA 

L'inserat de 4,0 kb du plasmide pAT213 porte le 
determinant de la resistance aux glycopeptides de 
E. faecium BM4147. Divers fragments de restriction de 
cet inserat ont ete sous-clones dans pUC18 et les 
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plasaudes recombinants specif iques de vanA dans E.coli 
ont ft. identifies par analyse sds-page des protein 
des fractions cytoplasnigue et n eabranaire ou des 
extreme de sacs bacteriens. cett. approche e ete 
utxlxsde car E^coli est intrinseguesent resistant au 
glycopeptide. vinsdrat ScoRV-SacH du plasmide pAT214 
(fxgure 2) code pour un polypeptide unique de 40 *Da 
qux mxgre conjointement avec VanA, issu des 
preparations neabranaires de E. faecim. BM4147. 

sdquence num^tidtgnc d. , ,, 

xdentxfxcation de 1» ,a T . „ ee codan< - a „,t 

de i,« TT" nUC " otldi ^ e * I'lnsdrat EcoEV-sacM 
b f danS PAT2 " a «* ddter*inde sur lesleux 
brxns de 1-adn seXon la stratdgie decrite . la figure 

T^nT* iMtl0n d " C ° a0nS ^ terain ^-« CTGA, TAA, 

a sontr > *" brin 

sontr. la prdsence d-un unique cadre de lecture 

ouvert (ORE) ayant une taille suffisante pour coder 

pour la Protein. VanA. ce cadre de lecture ORE 

IZ tTTZ ^ °° a0n ™ M P ° Sitlon 2 " * codon 

deduxte de ORE a dtd =o»parde avec celle de 1-extrdMitd 
K-tersxnale de VanA. Les neufs acides aminds identifids 
par le sequencage protdique sent codds par la sdquence 
nucleotidique ddbutant avec le codon atg t^ZZl* 

crad^r " 7 C * i9Ure 3> - Ce COdOT "Nation de 

caract^° n , *** ^ **»-»« (TGAAAGGAGA) , 

caractdrxstxque a-un site de liaison au ribosose (EES 

de bactdries a Gra-positif qui est cospldsentaire pour 

"IV de 1,ARNr dS 13 ——It* 16S de BaciUus 
SHbtiljs dans sa partis ( 3 . 0 H Ocouuccucc 5 .) (Moran et 
al, 1982, Mol. Gen. Genet. 186, 339-346). Dans ce cadre 
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ORF, il n'y a pas d'autr codon d« initiation ATG ou GTG 
entre les positions 281 et 377. La sequence de 1029 bp 
qui s'etend du codon ATG en position 377 au codon TGA 
en position 1406 code pour une proteine contenant 343 
residus d'acides amines. Le poids moleculaire calcule 
de cette proteine est 37400 Da ce qui est en accord 
avec 1« estimation de 40 kDa obtenue par 1« analyse SDS- 
PAGE. 

wo-moloaie des sequences d 'acides amines de VanA et 
des enzymes liaases D-ala-D-ala 

Le criblage de la banque de donnees de proteines, 
PSEQIP a montre 1' existence d'une homologie de 
sequences entre VanA et les ligases D-ala-D-ala de 
E.coli (ECOALA, Robinson et al, 1986, J. Bacterid 167; 
809-817) et de lamella tvphimurium ( DALIG , Daub et 
al, 1988, Biochemistry 27; 3701-3708). Le pourcentage 
de similarity calcule par paires de proteines etait 
compris entre 28% et 36% pour les acides amines 
identiques et entre 48% et 55% en tenant compte des 
acides amines homologues. VanA et DALIG sont plus 
etroitement liees. La signification statist ique de ces 
similarites a ete evaluee en alignant VANA et des 
sequences contenant la meme composition en acides 
amines que DALIG ou ECOALA (Lipraan et Pearson, 1985, 
Science 227; 1435-1440). 

TP. s t de complementation a enetioue pour l'activite 
de lipase D-ala-D-ala 

La souche E.coli ST640 est un mutant 
thermosensible presentant une activite ligase D-ala-D- 
ala deficiente (Lugtenberg et al, 1973, J. Bacterid 
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113 : 96-104) . Les plasmides pucis et P AT214 ont ete 
xntroduits par transformation dans E.coli ST640 Les 
souches ST640 et ST640 (pucie) ont pousse normalement 
unxquement a la temperature permissive (30'C) alors que 
l^olx ST640 (pAT214) a pousse a la fois a ^a 
temperature permissive et a la temperature non 
permissive (42'C). 

ce test montre que VANA est fonctionnellement 
apparentee aux D-Ala-D-Ala ligases dans E.coli et est 
probablement capable de catalyser la meme~TeIction de 
ligation que DALIG. 



II - Systeme 




de precurseur da 



peptideglycanea 



MATERIELS ET MTCTffnnpg 



Souches, pi abides et c »^^ ions d<a gul^g 

Les fragments de restriction de pi P8 i6 (Tra- 

PAT29 qu, constatue un vecteur navette entre les 
bacter,.es gram-positives et gram-negatives (oriR pAM/?i 
ori* pDC , oriT RK2, S pc, lacza) (Trieu-Cuot ela! 
19*0 Nuc ieic Acids Hes. 18:4296). Ce vecteur a £ 
construe par les inventeurs et utilise pour 
transformer la souche E^coli JM103 (A(lac-proAB) , supE, 

lacZAMIS) (Messing et al, 198 3/ Methods Enzymol 
101:2O- 78) . L'ADN plasmidique a et* pr.par, par^n 
protocol, de lyse alcaline * petite echel le (Sambroo* 
et al, 1982 , Molecular cloning, a laboratory manual 
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Cold Spring Harbor Laboratory, Cold Spring Harbor NY) 
et introduit par electrotransformation (Cruz-Rodz A.L. 
et al, 1990, Mol. Gen. Genet. 224= 152-154) dans fc. 
faecalis JH2-2 (Fus*, Rif") (Jacob A.E. et al, 1974, J. 
Bacterid. 117:360-372), en utilisant un appareil Gene 
Pulser (Bio-Rad Laboratories, Richmond, Califomie) . 
Les profils de restriction des plasmides purifies a 
partir de E - faecalis et de E.coli ont ete compares 
pour detecter d'eventuels rearrangements d'ADN. 

Le plasmide integratif P AT113 (Mob\ Em R , Km«, oriR 
PACYC184, attTnl545, LacZa) (Trieu-Cuot et al, Gene 
106:21-27) porte les extremites jointes du transposon 
1^1545. Ce vecteur ne se repligue pas dans les 
bacteries gram-positives mais s'integre au chromosome 
de l'hote par recombinaison illegitime mediee par 
1'integrase de Tnl545 ou de Tn916 (Trieu-Cuot et al 
precite) . Les plasmides integratifs ont ete introduits 
par electrotransformation dans E. faecalis BM4148 
(souche JH2-2::Tn916). Cette souche est modifiee par le 
transposon Tn916 decrit par Franque A.E. et al (1981, 
j. Bacteriol. 145 : 494-502). 

Les cultures ont ete realisees dans un bouillon 
coeur-cervelle (BHI - Brain Heart Infusion Broth) ou 
sur agar a 37 'C. La methode de Steers et al (Antxbiot. 
Chemother. Basel. 9:307-311) a ete utilisee pour 
determiner les concentrations minimales d' inhibition 
(Mies) des antibiotiques sur un milieu gelose Mueller- 
Hinton agar. 



Techniques d'ADN re combinant 

Le clivage de l'ADN avec des endonucleases de 
restriction (Boehringer Manheim and Pharmacia), la 
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purification des fragments d'ADN de restriction a 
partir des gels d'agarose, la conversion des extremites 
cohesxves en extremites franches avec le fragment de 
Klenow de 1 'ADN polymerase I de E.coli (Boehringer 
Manhexm), la dephosphorylation des extremites de 1 'ADN 
avec la phosphatase intestine de veau (Boehringer 
Manheim), la ligature des fragments d'ADN avec la T4 
DNA ligase (Amersham) ont ete realises selon les 
methodes standard de Sambrook et al (1982, Molecular 
Clonxng, a laboratory Manual. Cold Spring Harbor 
Laboratory. Cold Spring Harbor NY) . 



Constructio n de plasm^o 

L'origine des vecteurs et des inserats utilises 
pour les plasmides recombinants construits ici est la 
suivante : 

(i) vecteur p AT 78 pour la reconnaissance de 
promoteur : i.adn amplifie du gene cat de 
chloramphenicol acetyltransf erase du plasmide 
PC194 de Staphylococcus aureus (Horinouchi et al 
1982, j. Bacteriol. 150:815-825) a ete insert 
entre les sites de restriction Psti et Sphi du 
vecteur navette P AT29. L' amplification par la 
reactxon de polymerisation en chaihe a ete 
effectuee au moyen des amorces Al et A2 qui ont 
4te synthetisees par la methode au methoxy 
Phosphoramidite (Mabilat et al f 1990, Piasmid 
23:27-34). La sequence de l^morce Al 
(5'GCTGCAGATAAAAATTTAGGAGG) est composee d'un site 
de reconnaissance Psti (souligne) et de is bases 
(positions 6 4 23) de pci94 qui incluent le site 
de lxaxson au ribosome (rbs ; AGGAGG positions 18 
a 23) du gene cat. La sequence de 1 'amorce 
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A2 ( 5 ' C GCATGCT ATTATAAAA GCCAGTC) contient le site 
de clivage Sph I (souligne) et est complementaire 
(positions 8 a 24) a 17 bases de l'extremite 3' du 
gene cat. Le triplet ATT aux positions 9 a 11 
correspond au codon stop TAA de cat. Les fragments 
d'ADN amplifies avec les amorces Al et A2 
consistent done en une phase ouverte de lecture 
(orf) et en un site de liaison au ribosome pour 
CAT (positions 1234 a 1912 selon la numerotation 
de Horinouchi et al (1982, J. Bacterid . 
150:815-825) flanques par les sites Pstl et SphI. 
La position 1234 est localisee a l'interieur de la 
boucle de la structure secondaire de l'ARNm qui 
bloque la traduction en 1' absence de 
chloramphenicol. Ainsi la sequence amplifiee ne 
contient pas le promoteur cat ni la sequence 
complementaire du RBS qui est essentielle pour la 
regulation de traduction Ambulos, N.P et al, 1984, 
Gene 28:171-176) . 

(ii) vecteur d« expression pAT79 : le fragment de 
243 bp Clal-BssHII portant le promoteur P2 du gene 
aphA-3 du plasmide d • enterocogue pJHl (Caillaud et 
al, 1987, Mol. Gen. Genet. 207: 509-513) a ete 
insere entre les sites de restriction EcoRI et 
Sad de pAT78. 

(iii) plasmide pAT80 et ses derives : le fragment 
de 5,5 kb Bglll-Xbal de pIP816 a ete insere entre 
les sites BamHI et Xba l de pAT78. Le plasmide 
resultant denomme par pAT80 a ete partiellement 
digere avec Hind i et ligature avec le fragment 
EcoRV contenant un gene apparente au gene apha-I 
du transposon Tn903 (Oka A. et al, 1981, J. Mol. 
Biol. 147:217-226). Ce fragment contient le gene 
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aphA ~ I code P<>«r la 3 'aminoglycoside 

phosphotransf'rase de type i conferant la 
resistance a la kanamycine. L* insertion de aphA-I 
a ete realisee a trois sites differents dans 
PAT80, generant les plasmides pAT81, P AT83 et 
pAT85. Les cassettes BamHI et EcoRi contenant 
aphA-I ont ete inserees aux sites BamHI (pour 
former le plasmide pAT84) et EcoRi (pour former le 
plasmide pAT82) de pAT80. 

(iv) plasmide pAT86, pAT87, pAT88 et pAT89 : le 
plasmide pAT86 a ete construit par clonage du 
fragment de 2,803 bp, EcoRI-Sacli de pATSO codant 
pour VanH et VanA, au niveau d'un site Smal de 
PAT79. pAT87 a ete obtenu en inserant le fragment 
de 3,4 kb EcoRl-ajai de pATSO en amont du gene cat 
du vecteur de detection de promoteur pAT78. Le 
plasmide pAT88 resultait de la ligature de pAT78 
digere avec EcoRi et BamHI avec le fragment EcoRl- 
BamHi de 1,731 bp de pATSO. Le fragment Bglii- 
Accl (positions 1 a 2356) de pATSO a ete insere 
dans le polylinker du vecteur integratif pATH3, 
generant pAT89. 



Sous-clonag^ dans Ml 3 et secrupn^ryo 

Les fragments d'ADN de restriction ont ete sous- 
clones dans un polylinker de derives replicatifs du 
bacteriophage M13, ces derives etant appeles mpl8 et 
mpl9 (Norrander et al, 1983, Gene 26:101-106). E.coli 
JM103 a ete transfecte avec les phages recombinants et 
un ADN simple brin a ete prepare. Le seguencage des 
nucleotides a ete realise selon les conditions decrites 
par Sanger et al (Proc. Natl. Acad. Sci. USA, 1977, 74: 
5463-5467) en utilisant la polymerase d'ADN T7 modifiee 
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(Sequenase, United States, Biochemical Corporation 
Cliveland OH) et [a-35S]dATP (Amersham) . Les produits 
des reactions ont ete resolus sur des gels de gradients 
dans un tampon de poly aery 1 amide a 6%. 

Test enzymatique 

Les derives JH2-2 de E. faecalis ont ete cultives 
a une densite optigue OD^q de 0,7 dans un milieu BHI 
broth complete avec de la spectinomycine (300 fig/ml) • 
Les cellules ont ete traitees avec une lysozyme, lysee 
par sonication et les debris cellulaires ont ete 
centrifuges pendant 45 minutes a lOOOOOg selon la 
description de Courvalin et al (1978, Antimicrob. 
Agents Chemother. 13:716-725). La formation de 5- 
thio-2-nitrobenzoate a ete mesuree a 37 *C en presence 
et en 1» absence de chloramphenicol et l'activite CAT 
specifique a ete exprimee en micromole par minute et 
par milligramme de proteines (Shaw et al, 1975, Methods 
Enzymol. 43:737-755). 

RESULTATS 

Les genes vanH et vanA de pIP8l6 ont ete clones 
dans un plasmide pAT79 sous le controle du promoteur 
heterologue P2 (Caillaud et al, 1987, Mol. Gen. Genet. 
207 :509-513) et le plasmide pAT86 forme ne conferait 
pas a la souche E. faecalis JH2-2 la resistance a la 
vancomycine. Ces genes ne sont done pas suffisants pour 
la synthese de peptidoglycane en 1* absence de 
l ( antibiotique. Differents fragments de restriction de 
pIP816 ont ete clones dans le vecteur pAT78. Le 
fragment Bglll-Xbal de 5,5 kb de pAT80 est le plus 
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petit fragment obtenu qui conferait la resistance a la 
vancomycine. 

Sequence nucieotidierue des genes vanR et vans 

La sequence de I'inserat dans pAT80 a 6te 
determinee sur les deux brins de 1 'ADN a partir du site 
Bgl ll jusqu'au codon d» initiation de traduction ATG de 
VanH. Deux phases ouvertes de lecture (orf) ont ete 
mises en Evidence a l"interieur de la sequence de 2475 
bp : la premiere phase ouverte de lecture s'etend du 
nucleotide 386 au nucleotide 1123 ; en position 431 on 
trouve une sequence caracteristique des sequences RBS 
de bacteries gram-positives, 6 paires de base en amont 
du codon d» initiation de traduction ATG (TGAAAGGGTG) ? 
les autres codons d" initiation de traduction dans cette 
orf ne sont pas precedes de ce type de sequence. La 
sequence de 693 bp a partir du codon ATG au niveau 431 
jusqu'au codon TAA h la position 1124 est susceptible 
de coder pour une proteine de 231 acides amines avec 
une masse moleculaire de 26 f 612 Da et qui est designee 
par VanR. 

Pour la deuxieme phase ouverte de lecture (du 
nucleotide 1089 au nucleotide 2255) la sequence 
d 1 acides amines deduite a partir du premier codon 
d 1 initiation en phase (TTG en position 1104) coderait 
pour une proteine de 384 acides amines ayant une masse 
moleculaire de 43 , 847 Da et designee par Vans. Les 
codons TTG en position 1116 et ATG en position 1164 
sont des codons d» initiation de traduction en phase 
precedee par des sequences avec une faible 
complementarity avec la terminaison 3 'OH de la sous- 
unite 16S de I'ARN de B. subtil is ( GGGGGGTTGG— N8-TTG et 
AGAACGAAAA-N6 -ATG respectivement) . 
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Entre le dernier codon de vans et le codon 
d' initiation de traduction ATG de vanH on remarque une 
sequence de 217 bp qui contient une sequence inversee 
repetee de 17 bp. Cette sequence ne fonctionne pas 
comme un terminateur de transcription fort. 

La comparaison des sequences obtenues avec des 
bases de donnees a montre que les motifs d'acides 
amines conserves identifies par Stock et al (1989, 
Microbiol. Rev. 53:450-490) dans le domaine kinase de 
16 HPK (Histidine Protein Kinase) etaient detectes dans 
la partie C-terminale de Vans. Vans presente deux 
groupes d'acides amines hydrophobes dans la region N- 
terminale. Le residu Histidine 164 de Vans est aligne 
avec le residu His216 de PhoR (Makino et al, 1986, J. 
Mol. Biol. 192:549-556) et His 243 de EnvZ (Comeau et 
al, 1985, 164:578-584) qui sont des sites presumes 
d'autophosphorylation chez ces proteines. 

De meme les acides amines 1 a 122 de VanR 
presentent des similitudes avec les domaines effecteurs 
de regulateurs de reponse RR (Response Regulators) . 
L'acide aspartique 53 de VanR pourrait etre un site de 
phosphorylation puisque ce residu est aligne avec 
Asp 57 de Che Y qui est phosphoryle par HPK associe a 
CheA et correspond a une position invariante dans 
d'autres proteines de type RR (Stock et al precite) . 
VanR pourrait appartenir a la sous-classe OmpR-PhoB de 
rr qui active 1' initiation de transcription mediee par 

1 • ARN polymerase comportant le facteur a70S de E.coli 

(Stock et al precite) . 
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Inactivatio n par insertion des genes van 

Des cassettes de resistance a la kanamycine 
inserees dans le groupe de genes van, dans le plasmide 
PAT80 ont montre ceci : 1' insertion dans vanR supprime 
la resistance h la vancomycine et au chloramphenicol ; 
VanR est un activateur de transcription necessaire pour 
1 'expression des genes de resistance a la vancomycine. 
L» inactivation de vans conduit a une reduction de deux 
fois la concentration minimale inhibitrice (MIC) de 
chloramphenicol et a une reduction de trois fois de 
l'activite CAT specif ique mais la concentration 
mxnimale inhibitrice de vancomycine reste inchangee. 
Done Vans est necessaire pour obtenir un fort niveau de 
transcription des genes de resistance a la vancomycine 
bien gu'il ne soit pas reguis pour 1« expression du 
phenotype de resistance a la vancomycine. 

Des derives de pATSO portant des insertions dans 
vanH (pAT83), vanA ( P AT84) ou dans la region de 1,0 kb 
en aval de vanA <pAT85) , ont permis d'obtenir une 
resistance au chloramphenicol mais pas a la 
vancomycine. Ce phenotype dissocie correspond a 
1' inactivation de genes codant pour des enzymes qui 
synthetisent les precurseurs depsipeptidigues 
necessaires pour 1- assemblage des parois bacteriennes 
en presence de vancomycine. 

En aval du gene vanA, on a mis en evidence au 
niveau d'une sequence de 365 bp apres le codon tga de 
vanA et avant le site Sacll, la presence d'un orf 
inactive dans p A T85 et qui contient un codon 
d' initiation ATG en phase, precede d'une sequence RBS- 
like. cette sequence code pour une proteine necessaire 
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a la resistance au glycopeptide , d 'eigne par VanX et 
qui comprend au maximum 330 acides amines environ. 




Le plasmide integratif P AT89 codant pour VanR et 
Vans a ete introduit dans le chromosome de E. faecalis 
BM4138. Le plasmide pAT87 portant les genes vanH, vanA 
et vanX clones en amont du gene cat depourvu de 
promoteur de P AT78, a confere la resistance a la 
vancomycine a cette souche mais pas k B. 
JH2-2. Le niveau d' expression du gene cat de P AT87 dans 
les souches BM4138: :pAT89 et JH2-2 a indique que VanR 
active la transcription du gene reporteur localise a 
1'extremite 3' du groupe de genes van. Des niveaux 
similaires de synthese CAT ont ete observes pour P AT88 
qui porte une fusion de transcription entre les parties 
5- de vanA et le gene cat. Ces resulats montrent que 
dans E. faecalis BM4138: : P AT89 (pAT87) VanR et VanS 
codes par le chromosome activent en trans la 
transcription de vanA, vanH et vanX de P AT87 permettant 
l-obtention d'une resistance a la vancomycine. 

On a par ailleurs remarque que !• expression du 
gene etait essentiellement constitutive lorsque vanR et 
vans etaient portes par un plasmide multicopie pATSO et 
faiblement inductible par la vancomycine lorsque les 
genes pour les proteines de regulation etaient presents 
sur le chromosome de l f h6te. 
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?ases D-A la-D-Ala »+• a— 
51 i< 



jroteines 



arentees 



lees dans la r es i R j- a n ce a ia yangomj rclne 

La proline VanA necessaire a I'expression d'un 
haut nxveau de resistance aux glycopeptides dans 

!~ff BM414? enVir ° n 28 * 36 % de 

sxmxlxtude en acides amines avec les ligases D-Ala-D- 

Ala de £,0011 mais possede une specif icite de substrats 

d^w nte ^ 06116 ^ ligaSeS ' Des PeP^des 

desxgnes par 1 et 2 gui sent conserves dans les 

Bxocheaxstry 30:1673-1682) de E.coli et dans la 
proteine VanA ont ete selectionnes pour synthetiser les 
amorces universelles destinees a amplifier des 
fragments xnternes de genes codant pour des D-Ala-D-Ala 
Ugases ou enzymes apparentees. Les peptides cibles 
GEDd (S/T) (I/L)Q6 et NT (1/L) PGFT ont L traduits In 
retour comme le montre la figure iv.i, poU r obtenir des 
oligonucleotides dSgeneres VI et V2. Comma les peptides 
It 2 de VanA, DdlA et DdlB sont separes par des 
seguences decides amines de longueur similaire, la 
taxlle predite pour le produit d« amplification etait 
d« environ 640 bp. 

Une a„pli £ ication par FOR aveo i.adn da E.coli 
™« at da E^aaciag BM4147 a conduit a a^Uti^i 
prodmts corraspondant 4 la taille attandue, qui ont 

M13 BP10 (Norrander at al, 1983 , Gene 101 _ 106) P ^ 
saouan 9 aga da Linsarat obtanu avec E.coli ^ a 
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indique que le produit de PCR etait un fragment interne 
de ddlA. Une sonde genree a partir d'un phage 
recombinant obtenu avec le fragment d' amplification de 
BM4147 a ete utilisee pour 1' analyse Southern d'un ADH 
de BM4147 et de BM4147-1 qui est un derive de BM4147 
sensible a la vancomycine et qui est depourvu du 
plasmide pIP816 (Leclercq et al, 1988, N. Engl. J. Med. 
319:157-161). La sonde hybridait avec le fragment d'ADN 
EcoRI de 4 kb de BM4147 mais pas avec l'ADN de E^ 
faecium BM4 147-1. Comme le gene vanA est porte par le 
fragment EcoRI de 4 kb de pIP816, ces resultats 
indiquent que les amorces permettent egalement 
1' amplification d'une partie de vanA. Ainsi les 
oligonucleotides VI et V2 peuvent amplifier des 
fragments de genes codant pour des differentes 
proteines apparentees aux D-Ala-D-Ala ligases, et ce 
dans des especes differentes. 

Am plification T clonage et seoue ncaae du gene vanC 

Une amplification par PCR a ete realisee sur l'ADN 
total de E. aallinarum BM4174 et le produit 
d« amplification obtenu, d' environ 640 bp a et6 clone 
dans le bacteriophaghe M13mpl0. L'ADN simple brin isole 
a partir du phage recombinant a ete utilise pour 
construire une sonde C (Hu et al, 1982, Gene 
17:2171-2177). En analyse Southern la sonde hybridait 
avec un fragment Pstl de 1,7 kb de BM4174 mais pas avec 
l'ADN de BM4147 et BM4147-1. 

L'ADN de BM4174 a ete digere avec Pstl et des 
fragments de 1,5 et 2 kb ont ete purifies par electro- 
phorese sur gel d' agarose et clones dans pUCIS 
(Norrander et al, 1983, precite) . Les plasmides 
recombinants ont ete introduits dans E.coli JM83 par 
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transformation et cribles par hybridation sur colonies 
(Sambrook et al, 1989, Molecular cloning, a laboratory 
manual. Cold Spring Harbor Laboratory Press, cold 
Spring Harbor, NY) en utilisant la sonde c. Une 
homologie a ete detectee avec un transformant 
hebergeant un plasmide, appele P AT216, qui contenait un 
xnserat Pst X d e 1,7 kb. La sequence de la partie de 
1347 bp Saci-Psti de l.inserat de P AT216 a ete mise en 
evidence sur les deux brins d'ADN. La localisation des 
codons de terminaison dans les trois cadres de lecture 
de chaque brin d'ADN a revele la presence d'une phase 
ORF localxsee entre les codons TGA aux positions 47 et 
1244 Le codon d. initiation de transcription ATG en 

IITJI 011 - ^ ^ ™* S6qUSnCe ^AGGAAGA 

^ZT 7 1 * ^ S6 ^ ences «BS complementaire de 

1 ARN de la sous- unite 16S de B^ubtilis (Moran et 

lO^ 1 !?' MOl ', Gen - Genet ' M6:339-346) . La sequence de 
1029 bp qux s'etend du codon ATG en position 215 au 
codon TGA en position 1244 pourrait coder une proteine 
ae 343 acxdes amines ayant une masse moleculaire 
calculee de 37504Da designee par Vane. Une similitude 
de sequence a ete detectee entre VanC, VanA et les 
Ixgases D-Al a-D— Al a de E.coli. En particulier quatre 
domaxnes de forte homologie prealablement trouves entre 
VanA et les D-Ala-D-Ala ligases d • enterobacteries sent 
egalement presents dans VanC. Le pourcentage decides 
amxnes identigues calcule pour ces proteines prises 

deux a deux etait entre 29 **■ r , , • 

entre 29 et 38%. L'alignement des 

quatre sequences a revele la presence de 57 acides 
amxnes invariants qui incluent les residus conserves 
des peptxdes l et 2 utilises pour definir les sondes 
oixgonucleotidigues VI et V2. 
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I tivation Pa r in- rtion «m °ene vanC 

Pour evaluer la contribution de vanC a la 
resistance a la vancomycine chez K. qallinarum BM4174 
le gene vanC a ete inactive par insertion. Un fragment 
de 690 bp EcoW-HincII, interne a yanC a ete clone dans 
PAT114 qui ne se replique pas dans les bacteries gram- 
positives. Le plasmide P AT217 resultant a ete xntroduxt 
dans BM4174 par electrotransformation (Cruz-Rodz et al, 
19 90, Mol. Gen. Genet. 224:152-154) et les clones 
supposes resulter d'une recombinaison homologue 
conduisant a 1 ■ integration de pAT217 dans vanC ont ete 
selectionnes sur de 1 • erythromycin . Le clone BM4175 a 
ete compare a BM4174 par hybridation Southern en 
utilisant la sonde C et aphA-3 specifique de P AT114. 
L es deux sondes hybridaient avec le fragment EcoRI de 
8 6 kb de BM4175. La sonde C hybridait avec un fragment 
de 2 5 Kb de BM4174 alors qu'aucun signal n'etaxt 
observe avec la sonde aphA-3. Les resultats indiquent 
que le plasmide P AT217 de 6,1 Kb etait integre dans le 
gene vanC. La determination de la concentration minimum 
inhibitrice de vancomycine pour BM4174 (16 mg/1) et 
BM4175 (2 mg/1) a indique que 1 • inactivation par 
insertion dans vanC abolit la resistance a la 
vancomycine • 

VanC est done requise pour la resistance a la 
vancomycine. On peut done penser que cette proteine 
synthetise un dipeptide ou un depsipeptide qux est 
incorpore dans les precurseurs de peptidoglycanes et 
n'est pas reconnu par la vancomycine. 

Les sequences qui font 1'objet de !• invention sont 
donnees dans les pages suivantes apres la liste des 
s'quences contenant la description de ces sequences. 
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Dans la liste des sequences, les proteines sont 
reperees par rapport a la position des bases 
nucleotidiques correspondant aux acides amines des 
extremites des proteines. 
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A a a ou nc 3 

(contenues dans les sequences I (la, lb), II presentees 
ci-apres ou dans la sequence de la figure 5) . 

Sequences d' aci des amines 

« ™ rn tjq i fVanH) : sequence de la premiere proteine 
de resistance, correspondant a la sequence d- acides 
amines de la phase de lecture ouverte n* 3 , commencant 
a la base 3501 et se terminant a la base 4529, 
contenant la sequence codante du gene vanH entre les 
bases 3564 et 4529, par rapport a la sequence de la 
figure 5 ou correspondant a la sequence entre les 
positions des nucleotides 6018 et 6983 de la sequence 
la. 

ftv. q id NO 2 fVan&l : sequence de la proteine VanA, 
correspondant a la sequence d' acides amines de la phase 
de lecture ouverte n'l, commencant a la base 4429 et se 
terminant a la base 5553, par rapport a la sequence de 
la figure 5 ou correspondant a la sequence entre les 
positions des nucleotides 6977 et 7807 de la sequence 
la. 

seo ID NO 3 fVanX) : sequence de la troisieme proteine 
de resistance, correspondant a la sequence d' acides 
amines de la phase de lecture ouverte n« 3, commencant 
a la base 5526 et se terminant a la base 6167, par 
rapport a la sequence de la figure 5 ou correspondant a 
la sequence entre les positions des nucleotides 7816 et 
8621 de la sequence la. 

SEQ ID NO 4 (VanR) : sequence de la proteine de 
regulation R, correspondant a la sequence d- acides 
amines de la phase de lecture n'l, commencant a la base 
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1477 et se terminant a la base 2214, par rapport a la 
sequence de la figure 5 ou correspondent a la sequence 
entre les positions des nucleotides 3976 et 4668 de la 
sequence la. 

SEQ id NO 5 (vans) , : sequence de la proteine senseur 
• S, correspondant a la sequence d« acides amines de la 
Phase de lecture ouverte n'2, commencant a la base 2180 
et se terminant a la base 3346, par rapport a la 
sequence de la figure 5 ou correspondant a la sequence 
entre les positions des nucleotides 4648 et 5800 de la 
sequence la. 

SEQ id NO 16 : sequence de la transposase correspondant 
aux acides amines compris entre les nucleotides iso et 
3112 de la sequence lb. 

SEQ ID NO 37 : sequence de la resolvase comprenant les 
acxdes amines situes entre les positions de nucleotides 
3187 et 3759 de la sequence la. 

SEQ id no 18 . sequence VanY comprenant les acides 
amines situes entre les positions des nucleotides 9046 
a 9960 dans la sequence la. 

SEQ ID NO 1 9 : sequence VanZ comprenant les acides 
amines situes entre les positions des nucleotides 10116 
et 10598 dans la sequence la. 

SEQ ID m ™ 1 s ^ce Vane decides amines 
representee sur la liste II. 
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- se quences nucleot idioues 

figo ID NO 6 : sequence nucleotidique contenant la 
sequence codant pour les 5 proteines, ainsi que les 
sequences flanquantes, representee a la figure 5. 

fi F.o ID NO 7 : sequence contenant la sequence codant 
pour les 3 proteines de resistance, ainsi que les 
sequences flanquantes et commencant a la base 3501 et 
se terminant a la base 6167, representee a la figure 5. 

SEQ id NO 8 : sequence du gene van A, commencant a la 
base 4429 et se terminant a la base 5553, de la 
sequence presentee a la figure 5, ou correspondant a 
la sequence nucleotidique situee entre les nucleotides 
6977 et 7807 de la sequence la. 

seo id NO 9 : sequence codant pour la premiere proteine 
de resistance appelee VanH, commencant a la base 3501 
et se terminant a la base 4529, en particulier la 
sequence vanH dont la sequence codante est localisee 
entre les bases 3564 et 4529, de la sequence presentee 
a la figure 5, ou correspondant a la sequence 
nucleotidique situee entre les nucleotides 6018 et 6983 
de la sequence la. 

Qpo id NO 10 t sequence codant pour la troisieme 
proteine de resistance VanX, commencant a la base 5526 
et se terminant a la base 6167, de la sequence 
presentee a la figure 5, ou correspondant a la sequence 
nucleotidique situee entre les nucleotides 7816 et 8621 
de la sequence la. 

SE Q ID NO 11 : sequence du transposon codant pour la 
transposase, la resolvase, VanR, Vans, VanH, VanA, 
VanX, VanY et VanZ et contenant la sequence invsersee 
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repetee de 38 pb a ses extremites N- et C-terminales, 
et correspondent a la sequence la. 

SEg id no 1?. : sequence codant pour la transposase, 
commencant a la base 150 et se terminant a la base 3112 
de la sequence lb. 

SEQ 10 N ° lV : sequence codant pour la resolvase, 
commen ? ant a la base 3187 et se terminant a la base 
3759 de la sequence Xa. 

SEQ ID NO 34 : sequence codant pour VanY commencant a 
la base 9046 et se terminant a la base 9960 de la 
sequence la. 

SEQ ID NO : sequence codant pour VanZ co*men $ ant a 
la base 10116 et se terminant a la base 10598 de la 
sequence la. 

Pg = ■«*»-- «— t vane, ropresentee 

sur la i lste h en corresponaance avec ^ proMine 

vane* 

P 8 10 HO 77 ' complete la a„ transposon ae E. 

iaacim, co,«e„ 9 ant a la base l at se terminant a IT 
base 10851. 

SEQ 10 N ° 23 : s ^ence codant pour la proteine VanR, 
commencant * ia base 397 6 et se terminant a la base 
4668 de la sequence la. 

SEg ID M ° 7A ' ■*!»««« codant pour la proteine vans 

ZT7T * ^ ^ 4648 6t 36 *«— -* a la base 
5800 de la sequence la. 
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REVEM DICATIQNS 

1/ Composition de polypeptides, caracterisee en ce 
qu'elle comprend au moins une proteine ou partie de 
proteine choisie parmi les sequences d'acides amines 
identifiees dans la liste des sequences par SED ID NO 1 
(VanH) , SEQ ID NO 2 (VanA) , SEQ ID NO 3 (VanX) ou SEQ 
ID NO 19 (VanC), ou toute proteine ou partie de 
proteine reconnue par les anticorps diriges contre 
VanH, VanA, VanX ou VanC, ou toute proteine ou partie 
de proteine codee par une sequence hybridant avec l'un 
des enchainements nucleotidiques identifies dans la 
liste des sequences par SEQ ID NO 8, SEQ ID NO 9 , SEQ 
ID NO io ou SEQ ID NO 21 ou avec 1-une des sequences VI 
ou V2 suivantes dans des conditions stringentes ou peu 
stringentes : 

VI : GGX GAA GAT GGX TCX TTX CAA GGX 
G C AG C G 

A 

V2 : AAT ACX ATX CCX GGX TTT AC 
C . T c 
C 

2/ Composition de polypeptides selon la revendication 
1, caracterisee en ce qu'elle comprend au moins 3 
proteines ou toute partie de 1'une ou plusieurs de ces 
proteines necessaires pour conferer a des bacteries a 
Gram-positif, la resistance a des antibiotiques de la 
famxlle des glycopeptides, notamment a la vancomycine 
et/ou a la teicoplanine, ou de favoriser cette 
resistance, en particulier dans des souches de la 
famille des cocci a Gram-positif , ces proteines ou 
parties de proteines etant 

a) soit reconnues par des anticorps diriges contre 
l'une des sequences identifiees dans la liste des 
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sequences par SEQ ID NO 1 (VanH) , SEQ ID NO 2 
(VanA) , SEQ ID NO 3 (VanX) , 
b) soit codees par des genes comportant une sequence 
identifiee par SEQ ID NO 8, SEQ ID NO 9 ou SEQ ID 
NO 10 ou hybridant avec l'une de ces sequences ou 
sa sequence complementaire, dans des conditions 
stringentes ou peu stringentes ou avec les 
sequences VI ou V2. 
3/ composition de polypeptides selon la revendication 1 
ou 2, caracterisee en ce qu'elle correspond a 
1. association des proteines designees par SEQ ID NO 1 
(VanH) , SEQ ID NO 2 (VanA) , SEQ ID NO 3 (VanX) . 
4/ composition de polypeptides selon la revendication 
2 ou la revendication 3, caracterisee en ce que la 
proteine VanC correspondant a la sequence SEQ ID NO 19 
remplace la proteine VanA correspondant a la sequence 
SEQ ID NO 2. 

5/ Composition de polypeptides selon l'une quelconque 
des revendications 1 a 4, caracterisee en ce que les 
sequences d'acides amines necessaires a 1- expression de 
la resistance a des antibiotiques de la famille des 
glycopeptides, en particulier a la vancomycine et/ou a 
la teicoplanine, sont sous le controle d- elements de 
regulation, notamment des proteines correspondant aux 
sequences designees par SEQ ID NO 4 (VanR) ou SEQ ID NO 
5 (VanS) dans la liste des sequences. 

6/ composition selon l'une quelconque des 
revendications 1 a 5, caracterisee en ce qu'elle est 
codee par l'une des sequences SEQ ID NO 6, SEQ ID NO 
11, SEQ ID NO 22 identifies dans la liste des 
sequences . 

7/ Proteine purifiee caracterisee en ce qu'elle 
correspond a la sequence SEQ ID NO 2 (VanA) ou a la 
sequence SEQ ID NO 19 (VanC), contenues dans la 
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composition selon l'une quelconque des revendications 1 
a 3. 

8/ Proteine caracterisee en ce qu'elle correspond a 
l'une des sequences identifiees par SEQ ID NO 1 (VanH) , 
SEQ ID NO 3 (VanX), SEQ ID NO 4 (VanR) , SEQ ID NO 5 
(VanS) . 

9/ Sequence nucleotidique caracterisee en ce qu'elle 
code pour une sequence d'acides amines selon l'une 
quelconque des revendications l a 8, ou en ce qu'il 
s'agit d'une sequence d»ADN complementaire ou d'une 
sequence d'ARN correspondante . 

10/ Sequence nucleotidique de 7,3 kb environ, 
correspondant au fragment de restriction Hindlll-EcoRi 
tel qu'obtenu a partir du plasmide plP816, comprenant 
ce fragment Hindlll-EcoRi ou toute partie de ce 
fragment, en particulier le fragment de 3,4 kb EcoRi- 
Xbal,le fragment d' environ 1,7 kb EcoRV-SacIl et le 
fragment de 3,3 kb Hindlll-EeoRl. 

11/ Sequence nucleotidique selon la revendlcation 10, 
caracterisee en ce qu'elle comporte dans l'ordre les 
sites de restriction suivants tel qu'obtenus a partir 
du plasmide pIP8l6 : 

Hindlll, Bglli, Bglll, EcoRi, BamHl, Xbal, Ecori 
12/ Sequence nucleotidique selon l'une quelconque des 
revendications 8 a 10, caracterisee en ce qu'elle 
correspond a 1'un des enchainements identifies par SEQ 
ID NO 6, SEQ ID NO 7 ou SEQ ID NO 22, ou en ce qu'elle 
comprend un de ces enchainements ou toute partie de 
1'un de ces enchainements, ou encore tout enchainement 
ou partie d • enchainement d'ADN complementaire, ou tout 
enchainement d'ARN correspondant a 1'un de ces ADN, 
susceptible 

soit de constituer une sonde d • hybridation ou une 
amorce, pour la detection d'une resistance a des 
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antibiotigues de la famille des glycopeptides , 
notamment a la vancomycine et/ou a la 
teicoplanine, en particulier dans des souches de 
la famille des cocci a Gram-posit if , 
soit de coder pour une sequence necessaire a 
1- expression ou la regulation de la resistance a 
des antibiotigues de la famille des 
glycopeptides, notamment la vancomycine et/ou la 
teicoplanine, en particulier dans des souches de 
la famille des cocci a Gram-positif . 
13/ sequence nucleotidique selon la revendication 12, 
caracterisee en ce qu'elle comprend ou en ce qu'elle 
correspond a l'un des enchainements suivants : 
VI : GGX GAA GAT GGX TCX TTX CAA GGX 
G C AG C G 

A 

V2 : AAT ACX ATX CCX GGX TTT AC 
C T c 

C 

14/ Sequence nucleotidique selon l'une quelconque des 
revendications 10 a 12, caracterisee en ce qu'il s'agit 
de l'un des enchainements SEQ ID NO 8 (vanA) , SEQ ID NO 
9 (vanH) , SEQ ID NO 10 (vanX) , SEQ ID NO 21 (vanC) , SEQ 
ID N012(transposase), SEQ ID NO 13 (resolvase) , SEQ ID 
NO 14(vanY), SEQ ID NO 15(vanZ) , SEQ ID NO 23 (vanR) , 
SEQ ID NO 24 (vans) ou d'une variante de l'un de ces 
enchainements des lors gu'elle code pour une proteine 
ayant des proprietes immunologiques et/ou 
fonctionnelles similaires a celles des proteines codees 
par les enchainements SEQ ID NO 8 (vanA) , SEQ ID NO 9 
(vanH), SEQ ID NO 10 (vanX) , SEQ ID NO 21 (vane) SEQ ID 
N012(transposase), SEQ ID NO 13 (resolvase) , SEQ ID NO 
14(vanY), SEQ ID NO 15(vanZ), SEQ ID NO 23(vanR), SEQ 
ID NO 24 (vans) , ou d-s lors qu'elle permet la 
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detection de souches rsistantes a des antibiotigues de 
la famille des glycopeptides. 

15/ Sequence nucleotidique selon l'une quelconque des 
revendications 9 a 12, caracterisee en ce qu'elle 
correspond a 1 'enchainement SEQ id NO 6 ou a 
1' enchainement SEQ ID NO 22 ou en ce qu'elle comprend 
cet enchainement. 

16/ Sequence recombinante, caracterisee en ce qu'elle 
comprend une sequence de nucleotides selon 1'une 
quelconque des revendications 9 a 14, sous le contrdle 
d' elements de regulation susceptibles d' intervener dans 
1- expression, de la resistance a des antibiotigues de 
la famxlle des glycopeptides, notamment la vaneomycine 
ou la teicoplanine, chez un h6te determine. 
17/ Vecteur recombinant, caracterise en ce qu'il 
comprend une sequence nucleotidique selon l-une 
quelconque des revendications 9 a 16, en un site non 
essentiel pour sa replication, sous le controle 
d elements de regulation susceptibles d'intervenir dans 
1 ■ expression, de la resistance a des antibiotiques de 
la famille des glycopeptides, notamment la vaneomycine 
ou' la teicoplanine, chez un hote determine. 
18/ Vecteur recombinant selon la revendication 17 
caracterise en ce qu'il s'agit du plasmide pAT214. 
19/ H6te cellulaire recombinant, caracterise en ce 
qu'il comprend une sequence nucleotidique selon 1'une 
quelconque des revendications 9 a 16 ou un vecteur 
selon la revendication 17 ou la revendication 18, dans 
des conditions permettant 1- expression de la resistance 
a des antibiotiques de la famille des glycopeptides, 
notamment la vaneomycine ou la teicoplanine, cet h6te 
etant par exemple choisi parmi les bacteries, 
notamment les cocci a Gram-positif. 
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20/ sonde nucX-otiai^e. ^ 

d'hvbrider avec une sequence sexon x * 

a nyDnaer le cas echea nt 

revendicatxons 9 a 15, cette son ^ 
marquee, par exemple en ce qu'xl s agxt a 
nucleotides : 

VI : GGX GAA GAT GGX TCX TTX CAA GGX 
G C AG C G 

A 



ou 

V2 : AAT ACX ATX CCX GGX TTT AC 
C T C 

C 



21/ sonde nucleotidique selon la revendication 19 
21/ s»on«« n t S pecif ique chez des 

caracterisee en ce qu'elle est sp * 
Series a Gram-positif , des sequences codant pour une 
protfine de resistance a des glycopeptides nota^ent a 
fa vanco^ycine et/ou * la teicoplanine et universale 

parmi ces sequences. re vendication 20, 

22/ Sonde nucleotidique selon la revenax 

7 ~,,i«no est specif ique d'une 

caracterisee en ce qu'elle est sp * _ roteine 
sequence nucleotidique codant pour une P~* el * 

™ire a 1' expression d'un haut nxveau de 
necessaxre . il ^ de la famille des 

resistance a des antioioii4« 

sssr ■ t ==r , 

4 des antibiotiques de la famille des gxy e * 
particulier a la vanco^cine , chez des baoterxes 

Gram-positif . 
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24/ sonde nucleotidique selon 1-une quelcongue des 
revendications 20 a 23, caracterisee en ce qu'elle 
hybrxde avec une sequence nucleotidique non 
chromosomigue d'une souche resistante a des 
glycopeptides, notamment la vancomycine et/ou la 
teicoplanine, en particulier en ce gu'elle hybrids avec 
une sequence nucleotidique non chromosomigue d'une 

souche de cocci Gram-positif nar AVMm .i 

positxx, par exemple une souche 

d enterocogue et de preference E. faecium 4147. 
25/ Anticorps polyclonaux ou monoclonaux, caracterises 
en ce qu'ils reconnaissent la composition selon 1-une 
quelconque des revendications 1 a 6 ou une sequence 
dacxdes amines selon Lune quelconque des 
revendications 7 ou 8. 

26/ Kit pour le diagnostic in vitro sur un echantillon 
bxologique, de la presence de souches resistantes aux 
glycopeptides, en particulier a la vancomycine et/ou a 
la teicoplanine, ces souches appartenant en particulier 
aux cocci a Gram-positif, notamment en ce qu'il s'aait 
des souches d • enterocoques , par exemple E^aecium, 
caracterise en ce gu'ii comprend : 

des anticorps selon la revendication 25, le cas 
echeant marques, 

un reactif pour la detection d'une reaction 
immunologigue du type anticorps-antigene , 
le cas echeant des reactifs pour effectuer la lyse 
des cellules de 1 • echantillon teste 
27/ Kit pour le diagnostic in vitro de la presence de 
souches resistantes aux glycopeptides, en particulier 
res xstantes a la vancomycine et/ou a la teicoplanine, 
ces souches appartenant en particulier aux cocci a 
Gram-positif notamment en ce qu-il s'agit de souches 
d enterocoques, par exemple E. faecium, caracterise en 
ce qu»il comprend : 
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- une sonde nucleotidique selon l'une quelconque des 
revendications 20 a 24, at le cas echeant, 

- des oligonucleosides triphosphates dATP, dCTP, 

dTTP, dGTP, 

un agent de polymerisation d'ADN. 
28/ Precede de detection in vitro de la presence de 
souches resistantes aux glycopeptides , en particulier a 
la vancomycin at/ou a la teicoplanine, ces souches 
appartenant en particulier a la famille des cocci 
Gram-positif, notamment en ce qu'il s'agit de souches 
d'enterocoques, par exemple E. faecium ou E.qallinarum , 
caracterise en ce qu'il comprend : 

a) la mise en contact d'un echantillon biologique 
susceptible de contenir les souches resistantes, 
avec une amorce constitute par une sequence 
nucleotidigue selon l'une quelconque des 
revendications 20 a 24, capable d'hybrider avec 
une sequence nucleotidique recherchee, necessaxre 
a 1« expression de la resistance, cette sequence 
etant utilisee comme matrice, en presence des 4 
differents nucleosides triphosphates, et d'un 
agent de polymerisation, dans des conditions 
d« hybridation telles que pour chaque sequence 
nucleotidique ayant hybride avec une amorce, un 
produit d' elongation de chaque amorce 
complementaire de la matrice est synthetise, 

b) la separation de la matrice et du produit 
d'elongation obtenu, ce dernier pouvant alors 
egalement se comporter comme une matrice, 

c) la repetition de l'etape a) de facon a obtenir une 
quantite detectable des sequences nuoleotidiques 
recherchees , 

d) la detection du produit d' amplification des 
sequences nuoleotidiques . 
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Ly sLeuPhePheLeuLeuIleCy S *-ArgPhe T hr AS nArglleLy S *- LeuLeuPhe 
SerPheSerPheCysSerPheValArgAspLeuLeuThrValLeuAsnSerPhePheSer 

A laPheLeuPheAlaHisLeuLeuGluIleT y r-*ProTyr-*IleAlaSerPheGln 
AAGCTTTTCTTTTTGCTCATTTGTTAGAGATTTACTAACCGTATTAAATAGCTTCTTTTC 

SerHisCysProCysPheProHisHisSerPheLysCysSerAspSerArgGlnTyrAsn 
AlalleAlaLeuAlaSexHisThrlleLeuSerSerValVallleAlaGlySerllelle 

ProLeuProLeuLeuProThrProPhePheGlnVal— ***GlnAlaVal***Phe 
AGCCATTGCCCTTGCTTCCCACACCATTCTTTCAAGTGTAGTGATAGCAGGCAGTATAAT 

100 

p h eValPheSer-*LysIleTyrAlaPheMetGln-*MetAsnGlyIleThrIlePhe 
LeuPhePheLeuArgLysSerMetHisSerCysSerArg—MetAlaSerProPheSer 
CysPhePheLeuGluAsnLeuCysIleHisAlaValAspGluTrpHisHisHisPhePro 
TTTGTTTTTTCTTAGAAAATCTATGCATTCATGCAGTAGATGAATGGCATCACCATTTTC 

GlnSer***LeuMetLysValLeuLysCysHisSerIlePheThrGlnGlyLysSerTyr 
LyS AlaA S n******ArgTyrLeuAsnValIleArgTyrSerLeuArgValLysValThr 

Ly sLeuIleAspGluGlyThr***MetSerPheAs P IleHisSerGly***LysLeuGi n 
CAAAGCTAATTGATGAAGGTACTTAAATGTCATTCGATATTCACTCAGGGTAAAAGTTAC 

200 

LysValValPhcThrSerAsnPhePheGlnMetlleProLysCysIlePheProLeuArg 
LysSerTyrSerLeuArgIleSerPheLys***SerGlnSerValPheSerLeu***Gly 

SerArglleHisPheGluPheLeuSerAsnAspProLysValTyrPheProPheGluAsp 
AAAGTCGTATTCACTTCGAATTTCTTTCAAATGATCCCAAAGTGTATTTTCCCTTTGAGG 

300 
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IleMetlleLysArgGlyTrpThrAsnThrAsnLeuPheArcTyrlleLeuTyrAspArg 
******SerSerGluAspGlyLeuThrProneCy S PheAsj:lleTyrCysMetThrGlu 
AsnAspGlnAlaArgMetAsp***HisGlnSerValSeri:eTyrIleVal***ProAs n 
ATAATGATCAAGCGAGGATGGACTAACACCAATCTGTTTCGArATATATTGTATGACCGA 
* 

IleTrpAspAlaPheAspMetSerValTrpProThrGlyllerroLysAsnSer***Leu 

SerGlyMetLeuLeuIle^-ValTyrGlyGlnProGlyTyrArgArgThrAlaAsn*- 

LeuGlyCysPhe^-TyrGluCysMetAlaAsnArgAspThrGluGluGlnLeuIleGlu 

ATCTGGGATGCTTTTGATATGAGTGTATGGCCAACCGGGATACCGAAGAACAGCTAATTG 

400 

A S nSerLysSer***ThrValPhePheProProSerLauIleAsnTyrPhe*-llePro 
ThrAlaAsnProLysArgPheSerSerLeuLeuArgLeuLeurhrlleSerLysSerArg 
GlnGlnlleLeuAsnGlyPheLeuProSerPheAlaTyr—LeuPheLeuAsnProVal 
AACAGCAAATCCTAAACGGTTTTCTTCCCTCCTTCGCTTATTAACTATTTCTAAATCCCG 

PheGlyLysSerGluValGlyProGlnTyrProPhellePheArgAspLeuHisLysSer 
LeuGluLy S ValLy S *-ValProSerIleHisSerSerSerGlyIleCysIleLysAla 
TrpLysLy S ***SerArgSerProVaaserIleHisLeuGl a GlyPheAla***LysPro 
TTTGGAAAAAGTGAAGTAGGTCCCCAGTATCCATTCATCTTCAGGGATTTGCATAAAAGC 



500 



• 

LeuSerLeuPheArgCysLysGlnPheSerThrSerArgAsnrheHisSerValSerPhe 
CysLeuCysSerGlyValSerAsnSerLeuProLeuAlallePhelleGlnTyrHisSer 
ValSerValProVal-wAlalleLeuTyrLeuSerGlnPheSerPheSerllellePro 
CTGTCTCTGTTCCGGTGTAAGCAATTCTCTACCTCTCGCAATTTTCATTCAGTATCATTC 



600 
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HisPheCysIlePheAsnLeuLeuValGlnLeuTyrlleAsnArgValTyrSerlleAsp 
IleSerValPheSerIleTyr***PheAsnTyrIleSerIleGluCysThrLeuLeuIle 
PheLeuTyrPheGlnPheIleSerSerIleIleTyrGln"*SerValLeuTyr***Tyr 
CATTTCTGTATTTTCAATTTATTAGTTCAATTATATATCAATAGAGTGTACTCTATTGAT 



ThrAsnValValAsp-*****AsnHisSer*-*GluArgLeuIleArgLeuValSerLys 
GlnMet******ThrAspLysIleIleValLysSerValSer***As P LeuSerGlnLys 
LysCysSerArgLeuIleLysSer***LeuArgAlaSerKisLysThrCysLeuLysAsn 
ACAAATGTAGTAGACTGATAAAATCATAGTTAAGAGCGTCTCATAAGACTTGTCTCAAAA 

700 

MetArg***TyrPheAlaGluAsnArgLeu7yrSerCysGln5heAsp***ProGluSer 
***GlyAspIleLeuArgLysIleGlyTyrIleArgValSerSerThrAsnGlnAsnPro 
GluValllePheCysGlyLysSerValllePheValSerValArgLeuThrArglleLeu 
ATGAGGTGATATTTTGCGGAAAATCGGTTA7ATTCGTGTCAGTTCGACTAACCAGAATCC 



PheLysThrlleSerAlaValGluArgAspArgAsnGlyTyrTyrlleLysArgLysPhe 
SerArgGlnPheGlnGlnLeuA S nGluIleGlyMetAspIleIle***ArgGluSerPhe 
GlnAspAsnPheSerSer***ThrArgSerGluTrpIleLeuTyrLysGluLysValSer 
TTCAAGACAATTTCAGCAGTTGAACGAGATCGGAATGGATATTATATAAAGAGAAAGTTT 

800 

GlnGluGlnGlnArgIleAlaSerAsnPheLysLysCys***ThrIleTyrArgLysMet 
ArgSerAsnLysGlySerArgAlaThrSerLysSerValArgArgPheThrGlyArg*** 
GlyAlaThrLysAspArgGluGlnLeuGlnLysValLeuAspAspLeuGlnGluAspAsp 
CAGGAGCAACAAAGGATCGCGAGCAACTTCAAAAAGTGTTAGACGATTTACAGGAAGATG 

900 
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ThrSerPheMetLeuGlnThr***LeuGluSerLeuValValHisLysIleTyrLeuAsn 
HisHisLeuCysTyrArgLeuAsnSerAsnHisSer***TyrThrArgSerIle***Ile 
IlelleTyrValThrAspLeuThrArglleThrAxgSerTtrGlnAspLeuPheGluLeu 
ACATCATTTATGTTACAGACTTAACTCGAATCACTCGTAGTACACAAGATCTATTTGAAT 

***SerIleThrTyrGluIleLysArgGlnVal***AsnHis***LysIleHisGlyLeu 
AsnArg * * *HisThrArg* * *Ly sGlyLy sPheLys IleThrLy sArgTyrMet Ala * * * 

IleAspAsnlleArgAspLysLysAlaSerLeuLysSerLeuLysAspThrTrpLeuAsp 
TAATCGATAACATACGAGATAAAAAGGCAAGTTTAAAATCACTAAAAGATACATGGCTTG 

1000 

IleTyrGlnLysIleIleHisThrAlaAsnSer***LeuLeu-**TrpLeuValLeuThr 
PheIleArgArg***SerIleGlnProIleLeuAsnTyrCysAsnGlyTrpCys***Pro 
LeuSerGluAspAsnProTyrSerGlnPheLeuIleThrValMetAlaGlyValAsnGln 
ATTTATCAGAAGATAATCCATACAGCCAATTCTTAA7TACTGIAATGGCTGGTGTTAACC 
* 

Asn * * *SerGluIleLeuPheGly * * *AspAsnVa lLy sGlyLeuAsnTrpLeuArgLy s 
IleArgAlaArgSerTyrSerAspGluThrThr***ArgAsp***lleGly***GluArg 
LeuGluArgAspLeuIleArgMetArgGlnArgGluGlylleGluLeuAlaLysLysGlu 

AATTAGAGCGAGATCTTATTCGGATGAGACAACGTGAAGGGATTGAATTGGCTAAGAAAG " 

1100 .... 

LysGluSerLeuLysValAsp***ArgSerIleIleLysIleThrGlnGlu***IleMet 
ArgLysVal***ArgSerIleLysGluValSer***LysSerArgArgAsnGluLeuCys 
GlyLysPheLysGlyArgLeuLysLysTyrHisLysAsnHisAlaGlyMetAsnTyrAla 
AAGGAAAGTTTAAAGGTCGATTAAAGAAGTATCATAAAAATCACGCAGGAATGAATTATG 

1200 
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ArgArgLysLeuTyrLysGluGlyAsnMetThrValAsnGlnlleCysGluIleThrAsn 
Gl y GluSerTyrIleLy S LysGluIle"*Leu***IleLys?heValLysLeuLeuMet 
AlaLysAlaIle***ArgArgLysTyrAspCysLysSerAsnLeu"*A 5 nTyr***Cys 
CGGXXAAAGCTATATAAAGAAGGAAATATGACTGTAAATCAAATTTGTGAAATTACTAAT 

ValSerArgAlaSerLeuTyrArgLysLeuSerGluValAsnAsn***ProPheCysIle 
TyrLeuGlyLeuHisTyrThrGlyAsnTyrGlnLys***IleIleSerHisSerValPhe 
Ile***GlyPheIleIleGlnGluIleIleArgSerGlu*«*LeuAlaIleLeuTyrSer 
GTATCTAGGGCTTCATTATACAGGAAATTATCAGAAGTGAA1AATTAGCCATTCTGTATT 

1300 

ProLeuMetGlyAsnIlePheLysGluGluLysGluThrIleLysTyr***GlnProPro 
Arg***TrpAlaIlePheLeuLysLysLysArgLysLeu**»AsnIleAsnSerLet:Leu 
AlaAsnGlyGlnTyrPhe***ArgArgLysGlyAsnTyrLysIleLeuThrAlaSer**« 
CCGCTAATGGGCAATATTTTTAAAGAAGAAAAGGAAACTATAAAATATTAACAGCCTCCT 

SerAspAlaGluLysProPheAspLysLysArgIleIleIleleuArgAsnSer***Ser 
AlaMetProLysSerProLeulleLysLysGluSerSerSer***GluIleLeuSerHis 
ArgCysArgLysAlaLeu******LysLysAsnHisHisLeuLysLysPheLeuValIle 
AGCGATGCCGAAAAGCCCTTTGATAAAAAAAGAATCATCATCTTAAGAAATTCTTAGTCA 

1400 • 

PheIleMet***MetLeuIleAsnSerAlaLeu***SerAspLysLeuLeuArgAlaAsn 
LeuLeuCysLysCysLeu***IleArgProTyrAsnLeuIleAsnTyr***GlyGlnThr 
TyrTyrValAsnAlaTyrLysPheGlyProIleIle**«-*IleIleLysGlyLysLeu 
TTTATTATGTAAATGCTTATAAATTCGGCCCTATAATCTGATAAATTATTAAGGGCAAAC 

1500 
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LeuCysGIuArgVallleThrMetSerAspLysIleLeuIleValAspAspGluHisGlu 

TyrValLy S Gly******Leu***AlaIleLysTyrLeuLeuTrpMetMetAsnMetLys 
Met * * *Ly sGlyAspAsnTyr GluArg * * * AsnThrTyrCysGly * * * * * *Thr * * * Asr 

TTATGTGAAAGGGTGATAACTATGAGCGATAAAATACTTATTGTGGATGATGAACATGAA 
* 

IleAlaAspLeuValGluLeuTyrLeuLysAsnGluAsnTyrThrValPheLysTyrTyr 
LeuProIleTrpLeuAsnTyrThr***LysThrArgIleIleArgPheSerAsnThrIle 
CysArgPheGly***IleIleLeuLysLysArgGluLeuTyrGlyPheGlnIleLeuTyr 

ATTGCCGATTTGGTTGAATTATACTTAAAAAACGAGAATTATACGGTTTTCAAATACTAT 

1600 

ThrAlaLysGluAlaLeuGluCysIleAspLysSerGluIleAspLeuAlalleLeuAsp 
ProProLysLysHisTrpAsnVal***ThrSerLeuArgLeuThrLeuProTyrTrpThr 
ArgGlnArgSerlleGlyMetTyrArgGlnVal»**Asp*«*ProCysHisIleGlyHis 
ACCGCCAAAGAAGCA7TGGAATGTATAGACAAGTCTGAGATTGACCT7GCCATATTGGAC 
* 

IleMetLeuProGlyThrSerGlyLeuThrlleCysGlnLysIleArgAspLysHisThr 

SerCysPheProAlaGlnAlaAlaLeuLeuSerValLysLys***GlyThrSerThrPro 

HisAlaSerArgHisLysArgProTyrTyrLeuSerLysAsnLysGlyGlnAlaHisLeu 

ATCATGCTTCCCGGCACAAGCGGCCTTACTATCTGTCAAAAAATAAGGGACAAGCACACC 

1700 

• 

TyrProIlelleMetLeuThrGlyLysAspThrGluValAspLysIleThrGlyLeuThr 
IleArgLeuSerCys***ProGlyLysIleGlnArg***IleLysLeuGlnGly***Gln 
SerAspTyrHisAlaAs P ArgGluArgTyrArgGlyArg***AsnTyrArgValAsnAsn 
TATCCGATTATCATGCTGACCGGGAAAGATACAGAGGTAGATAAAATTACAGGGTTAACA 

1800 
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IleGlyAlaAspAspTyrlleThrLysProPheArgProLeuGluLeuIleAlaArgVal 
SerAlaArgMetIleIle***ArgSerProPheAlaHisTr?Ser***LeuLeuGly*** 
ArgArgGly***LeuTyrAsnGluAlaLeuSerProThrGlyValAsnCysSerGlyLys 
ATCGGCGCGGATGATTATATAACGAAGCCCTTTCGCCCACTGSAGTTAATTGCTCGGGTA 

LysAlaGlnLeuArgArgTyrLysLysPheSerGlyValLysGluGlnAsnGluAsnVal 
ArgProSerCysAlaAspThrLysAsnSerValGlu***ArcSerArgThrLysMetLeu 
GlyProValAlaProIleGlnLysIleGlnTrpSerLysGiyAlaGluArgLysCysTyr 
AAGGCCCAGTTGCGCCGATACAAAAAATTCAGTGGAGTAAAGSAGCAGAACGAAAATGTT 

1900 

IleValHisSerGlyLeuVallleAsnValAsnThrHisGluCysTyrLeuAsnGluLys 
SerSerThrProAlaLeuSerLeuMetLeuThrProMetSerValIle***ThrArgSer 
ArgProLeuArgProCysHis * * *Cys * * *KisPro* * *ValLeuSerGluArgGlu Ala 
ATCGTCCACTCCGGCCTTGTCATTAATGTTAACACCCATGAG7GTTATCTGAACGAGAAG 

GlnLeuSerLeuThrProThrGluPheSerlleLeuArglleLeuCysGluAsnLysGly 
SerTyrProLeuLeuProProSerPheGlnTyrCysGluSerSerValLysThrArgGly 
ValIleProTyrSerHisArgValPheAsnThrAlaAsnProLeu***LysGlnGlyGlu 
CAGTTATCCCTTACTCCCACCGAGTTTTCAATACTGCGAATCCTCTGTGAAAACAAGGGG 

2000 . 

AsnValValSerSerGluLeuLeuPheHisGluIleTrpGlyAspGluTyrPheSerLys 
MetTrpLeuAlaProSerCysTyrPheMetArgTyrGlyAlaThrAsnlleSerAlaArg 

CysGly***LeuArgAlaAlaIleSer***AspMetGlyArgArgIlePheGlnGlnGlu 
AATGTGGTTAGCTCCGAGCTGCTATTTCATGAGATATGGGGCGACGAATATTTCAGCAAG 

2100 
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SerAsnAsnThrlleThrValHisIleArgHisLeuArgGluLysMetAsnAspThrlle 
AlaThrThrProSerProCysIleSerGlyIleCysAlaLysLys***ThrThrProLeu 
GlnGlnHisHisHisArgAlaTyrProAlaPheAlaArgLysAsnGluArgHisHis*** 
AGCAACAACACCATCACCGTGCATATCCGGCATTTGCGCGAAAAAATGAACGACACCATT 
* 

AspAsnProLysTyrIleLysThrValTrpGlyValGlyTyrLysIleGluLys***Lys 
IleIleArgAsnIle***LysArgTyrGlyGlyLeuValIleLysLeuLysAsnLysLys 
* * * SerGlu IleTy rLy s AsnG lyMet GlyGlyTrpLeu * **Asn***LysIleLysLys 

GATAATCCGAAATATATAAAAACGGTATGGGGGGTTGGTTATAAAATTGAAAAATAAAAA 

2200 

LysArgLeuPheGlnThrArgThrLysThrLeuHisValTyrArgCysAsnCysCysGly 
AsnAspTyrSerLysLeuGluArgLysLeuTyrMetTyrlleValAlalleValValVal 
ThrThrlleProAsn * * *AsnGluAsn?he7hrCys IleSerLeuGlnLeuLeuTrp * ** 

AAACGACTATTCCAAACTAGAACGAAAACTTTACATGTATATC3TTGCAATTGTTGTGGT 
* 

SerAsnCysIleArgValValTyrSerPheAsnAspProArgGluThrTrpGlyLeuAsp 
AlalleValPheValLeuTyrlleArgSerMetlleArgGlyLysLeuGlyAspTrplle 
GlnLeuTyrSerCysCysIlePheValGln***SerGluGlyAsnLeuGlyIleGlySer 

AGCAATTGTATTCGTGTTGTATATTCGTTCAATGATCCGAGGGAAACTTGGGGATTGGAT 

2300 

LeuLysTyrPheGlyLysGlnIle***LeuLysSerProGlyArgAspGluIleIleSer 
LeuSerlleLeuGluAsnLysTyrAspLeuAsnHisLeuAspAlaMetLysLeuTyrGln 
* * * ValPheTrpLysThrAsnMetThr * * *IleThrTrpThrArg * * * AsnTyr I leAsn 

CTTAAGTATTTTGGAAAACAAATATGACTTAAATCACCTGGACGCGATGAAATTATATCA 



2400 
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IlePh eH i sThrGluGlnTyrAr 9 TyrLeaTyrLeuCy S GlyA5pCysHis...TyrS.r 
lyr S e rIl«r 9 A,n* S nIle*spnePheIUTyrV.lAl.Il«V.meSeri ae Le» 

UeFroTyr G lyTbrne—IleSerLeuPhe«=t:TrpAr 9 Leu S erLeuV a lPheLe U 
ATATTCCATACGGAACAATATAGATATCTTTATTTATGTGGCGATTGTCATTAGTATTCT 



Tyr serMet S erAr g HisAlaPheLysneAr 9 LysIleLeu...ArgA SP I.y S TyrAr, 
HeL.uCy.ArgValMetLeuS.rLysPh.AlaLysTyrPh.AspGluHeAsnThrGly 

Phe 
TATTCTATGT 



TyrValAlaSerCysPheGlnAsnSerGlnAsnThrLeuThrArg-^leProAla 
rCGCGTCATGCTTTCAAAATTCGCAAAATACTTTGACGAGATAAATACCGG 



2500 

His - 'CysThrTy rSerGluArgArg" 'ThrAsn * * * AlaPheCy sGlyAsnGlyCy s 
neAspValLeuIleGlnAsnGluAspLysGlnlleGluLeuSerAlaGluMetAspVal 
LeuMetTyrLeuPheArgThrLysIleAsnLysLeuSerPVeLeuArgLysTrpMetLeu 
CATTGATGTACTTATTCAGAACGAAGATAAACAAATTGAGC77TCTGCGGAAATGGATGT 

TyrGlyThrLysAlaGlnHisIleLysThrAspSerGlyLysAlaArgAlaGlyCysLys 
M etGluGlnLysLeuAsnThrLeuLysArgTh= L euGluLysArgGluGlnAs P AlaLys 

TrpA snLysSerSerThrHis-*AsnGlyLeuTrpLysSerGluSerArgMetGlnSer 
tatggaacaaaagctcaacacattaaaacggactctggaaaagcgagagcaggatgcaaa 

2600 • 

AlaGlyArgThrLysLys L ys-*ArgCysTyrValLeuGlyAlaArgTyr-*AsnAla 



LeuAlaGluGlnArgLysAsnAspValValMetTyrLeuAlaHisAspIleLysThrP 
TrpProAsn 



ro 



j.ysGluLysMetThrLeuLeuCysThrTrpArgThrlleLeuLysAtgPro 



GCIGGCCGAACAAAGAAAAAATGACGTTGTTATGTACTTGGCGCACGATATTAAAACGCC 

2700 
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ProTyrIleHisTyrArgLeuPheGluProAla***ArgGlySerArgHisAlaGlyArg 
LeuThrSerllelleGlyTyrLeuSerLeuLeuAspGluAlaProAspMetProValAsp 
LeuHisProLeuSerValIle***AlaCysLeuThrArgLeuGlnThrCysArg***Ile 
CCTTACATCCATTATCGGTTATTTGAGCCTGCTTGACGAGGC7CCAGACATGCCGGTAGA 
• 

SerLysGlyLysValCysAlaTyrHisValGlyGlnSerValSerThrArgThrAlaAsn 
GlnLysAlaLysTyrValHisIleThrLeuAspLysAlaTyrArgLeuGluGlnLeuIle 
LysArgGlnSerMetCysIleSerArgTrpThrLysArgIleAspSerAsnSer***Ser 
TCAAAAGGCAAAGTATGTGCATATCACGTTGGACAAAGCGTA7CGACTCGAACAGCTAAT 

2800 

ArgArgValPhe***AspTyrThrVal***ProThrAsnAspAsnAlaAsnLysAsnAla 
AspGluPhePheGluIleThrArgTyrAsnLeuGlnThrlleThrLeuThrLysThrHis 
ThrSerPheLeuArgLeuHisGlyIleThrTyrLysArg«»»Arg***GlnLysArgThr 
CGACGAGTTTTTTGAGATTACACGGTATAACCTACAAACGA7AACGCTAACAAAAACGCA 
* 

HisArgProIleLeuTyrAlaGlyAlaAspAspArg-**lleleuSerSerAlaPheArg 

IleAspLeuTyrTyrMetLeuValGlnMetThrAspGluPheTyrProGlnLeuSerAla 

***ThrTyrThrIleCysTrpCysArg***ProMetAsnPheIleLeuSerPheProHis 

CATAGACCTATACTATATGCTGGTGCAGATGACCGATGAATTTTATCCTCAGCTTTCCGC 
2900 

• • 

ThrTrpLysThrGlyGlyTyrSerArgProArgGlySerAspArgValArgArgPro*** 
HisGlyLysGlnAlaVallleHisAlaProGluAspLeuThxValSerGlyAspProAsp 
MetGluAsnArgArgLeuPheThrProProArgIle***?roCysProAlaThrLeuIle 
ACATGGAAAACAGGCGGTTATTCACGCCCCCGAGGATCTGACCGTGTCCGGCGACCCTGA 

3000 
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...Th rt r 9 G 1 uSerLeu».Gl»BisPh eG luLysXr,AxcCy»li e Gl«."Giy» 
LysLe uAlaAr,V i l P h.«nA,nIl.LeuLys*,n*l.Aaa Mi TyrSer G10 AspA SD 
AsnSerAr^luSerL.uThrThrPhe.-LysThrProI.uHisThrValA^neThr 
TAAACTCGCGAGAGTCTTTAACAACATTTTGAAAAACGCCGC7GCATACAGTGAGGATAA 



G l„ Bi .His."Hi S IyrAr g Gly P roL.uAr 9 GlyCysG 1 yV.lA.nAr g IleGlnGl 0 
Serllell.A.pIlell.rAi.GlyL.uS.rGlyAspV.lValSerll.G^h.lysA.n 

Alai 
CAGCATCATTGAC 



.SerLeuThrLeuProArgAlaSerProGlyMetTrpCysGlnSerAsnSerArgThr 
^CATTACCGCGGGCCTCTCCGGGGATGTGGTSTCAATCGAATTCAAGAA 

3100 

HisT^ysHisProLyaArg— Al,SerCy.Bi. I le...-ysValL e u...A l aGly 
^rGlySerXlaProLysAspLysLeuAlaAlallePheGl.LysPheTyrArgLeuAsp 

leu01 uA a aSerGlnLy.IleS.r...L.uProTyrL.uly. S .r S erI l .GlyTrpThr 
CACTGGAAGCATCCCAAAAGATAAGCTAGCTGCCATATTTGAAAAGTTCTATAGGCTGGA 



cArgSerSerAapThrGlyGlyAlaGlyleuGlyLeuAlalleAlaLyaGlutla 
.IleArgValAlaArgAspLeuAapTipArgLeuGlnLyslysteu 



GlnPhaSerPhePheAr,TyrGlyTrpAr,GlyThrTrp I laG l yAspCysI.ysAr,Asn 

AsnSer/ 

I leLeuVa ILeuP r o ] 
CAATTCTCGTTCTTCCGATACGGGTGGCGCGGGACTTGGATTGGCGATTGCAAAAGAAAT 

3200 • 

TytC y,S.rAl. T rpAr,Al.A 8 pLe»ArgGly 1 .y.L.u...".L.«IyrA S pV.l." 
I1 eValG 1 »HisGlyGlyGln I leTyrA 1 aGluS.rTyrA S pAs„ T yrThrThrPheAr, 

M »Ph.Ser«et G l»GlyAr,PheIhrAr g LysAla M .tneThr I XaAr,Ar,Leu G1 y 

TATTGTTCAC 



.GCATGGAGGGCAGATTTACGCGGAAAGCTATGA7AACTATACGACGTTTAG 



3300 
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GlyArgAlaSerSerAspAlaArgLeuGly » » * - * *LysGluValLeuArgAspValTyr 

ValGluLeuProAlaMetProAspLeuValAspLysArgArgSer***GluMetTyrIle 
* * * SerPheGlnArgCysGlnThrTrpLeu IleLysGly GlyProLysArgCys He * * * 

GGTAGAGCTTCCAGCGATGCCAGACTTGGTTGATAAAAGGAGGTCCTAAGAGATGTATAT 

AsnPheLeuGlyLysSerGlnGlyTyrLeuTyrPhePheLeuGlyAsn***GlnPheAsn 

IlePhe***GluAsnLeuLysValIlePheThrPheSer***GluIleAsnAsnLeuIle 

PhePheArgLysIleSerArgLeuSerLeuLeuPheLeuArgLysLeuThrIle***Tyr 

AATTTTTTAGGAAAATCTCAAGGTTATCTTTACTTTTTCTTAGGAAATTAACAATTTAAT 

3400 

• 

HeLysLysArgLeuValLeuThrArg***Thr***TyrArcLysAsnGluProPheSer 
LeuArgAsnGlySerPheLeuHisGlyArgLeuAsnThrValArgThrSerArgPheArg 
***GluThrAlaArgSerTyrThrValAspLeuIlePro«**GluArgAlaValPheVal 
ATTAAGAAACGGCTCGTTCTTACACGGTAGACTTAATACCGTA^GAACGAGCCGTTTTCG 

PhePheArgGluArgPheAspLysIleThrlleGlylleProValLeuPheGlyAlaPhe 

SerSerGluLysAspLeuThrArgLeuProLeiaAlaSerProPheTyrLeuValProPhe 

LeuGi n ArgLysIle***GlnA S pTyrHisTrpHi S ProArgPheIleTrpCysLeuSer 

TTCTTCAGAGAAAGATTTGACAAGATTACCATTGGCATCCCCGTTTTATTTGGTGCCTTT 

3500 

HisArgLysGlyTrpSer***Leu***lleThrSerAlaLeuLeuPheMetA S pValSer 
ThrGluArgValGlyLeuAsnTyrGlu***HisArgHisTyrCysLeuTrpMet***Ala 
GlnLysGlyLeuValLeuIleMetAsnAsnlleGlylleThrValTyrGlyCysGluGln 
CACAGAAAGGGTTGGTCTTAATTATGAATAACATCGGCATTACTGTTTATGGATGTGAGC 

3600 
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ArgMetArgGlnKetHisSerMetLeuPheArgLeuAlaLe^laLeuTrpGlnArg- 
G i y ***GlyArgCysIleProCysSerPheAlaSerLeuTr?ArgTyrGlyAsnAs P Asn 
AspGluAlaAspAlaPheHisAlaLeuSerProArgPheGlyValMetAlaThrllelle 
AGGATGAGGCAGATGCATTCCATGCTCTTTCGCCTCGCTTTG3CGTTATGGCAACGATAA 

LeuThrProThrCysArgAsnProThrProAsnProArgLeuSerlleAsnValSerVal 
^-ArgGlnArgValGlylleGlnArgGlnlleArgAlaPbeGlnSerMetTyrGlnCys 
AsnAlaAsnValSerGluSerAsnAlaLysSerAlaProPheAsnGlnCysIleSerVal 
TTAACGCCAACGTGTCGGAATCCAACGCCAAATCCGCGCCT7TCAATCAATGTATCAGTG 

3700 

TrpAspIleAsnGlnArgPheProProLeuPhePheLeuArg— ArgGluProVal*" 
GlyThr—IleArgAspPheArgLeuTyrSerSerCysAIaGluGluSerArgCysGlu 
GlyHisLysSerGluIleSerAlaSerlleLeuLeuAlaleuLysArgAlaGlyValLys 
TGGGACATAAATCAGAGATTTCCGCCTCTATTCTTCTTGCGCTGAAGAGAGCCGGTGTGA 

AsnIlePheLeuProGluAlaSerAlaAlaIleIle-*IleC-lnLeuLeuLeuArgGlu 
IleTyrPheTyrProLysHisArgLeuGlnSerTyrArgTyrAsnCysCys^-GluAsn 
TyrlleSerThrArgSerlleGlyCysAsnHisIleAspThrThrAlaAlaLysArgMet 
AATATATTTCTACCCGAAGCATCGGCTGCAATCATATAGATACAACTGCTGCTAAGAGAA 

3800 • 

TrpAlaSerLeuSerThrMetTrpArgThrArgArglleAlaLeuProIlelleLeu** 
GlyHisHisCysArgGlnCysGlyValLeuAlaGly—AxcCysArgLeuTyrTyrAsp 
GlylleThrValAspAsnValAlaTyrSerProAspSerValAlaAspTyrThrMetMet 
TGGGCATCACTGTCGACAATGTGGCGTACTCGCCGGATAGCGTTGCCGATTATACTATGA 

3900 
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Cys*-PheLeuTrpGlnTyrAlaThr-*A S nArgLeuCysAlaLeuTrpLysAsnMet 
AlaAsnSerTyrGlySerThrGlnArgLyslleAspCysAlaLeuCysGlyLysThr*** 
LeuIleLeuMetAlaValArgAsnValLysSerlleValArgSerValGluLysHisAsp 
TGCTAATTCTTATGGCAGTACGCAACGTAAAATCGATTGTGCGCTCTGTGGAAAAACATG 

IleSerGlyTrpThrAlaThrValAlaArgTyrSerAlaThr«*GlnLeuValTrpTrp 

PheGlnValGlyGlnArgProTrpGlnGlyThrGlnArgHisAspSerTrpCysGlyGly 

PheArgLeuAspSerAspArgGlyLysValLeuSerAspMetThrValGlyValValGly 

ATTTCAGGTTGGACAGCGACCGTGGCAAGGTACTCAGCGACATGACAGTTGGTGTGGTGG 

4000 

GluArgAlaArg-*AlaLysArgLeuLeuSerGlyCysGluAspLeuA S pValLysCys 
AsnGlyProAspArgGlnSerGlyTyr—AlaAlaAlaArclleTrpMet—SerVal 
ThrGlyGlnlleGlyLysAlaVallleGluArgLeuArgSlyPheGlyCysLysValLeu 
GAACGGGCCAGATAGGCAAAGCGGTTATTGAGCGGCTGCGAC-GATTTGGATGTAAAGTGT 
* 

TrpLeuIleValAlaAlaGluVal * * *Arg* * 'ThrMetTyrArgLeuMetSerCysCys 
GlyLeu * * *SerGlnProLysTyrArgGlyLysLeuCy sThxVal ***** * ValAlaAla 

AlaTyrSerArgSerArgSerlleGluValAsnTyrValProPheAspGluLeuLeuGln 

TGGCTTATAGTCGCAGCCGAAGTATAGAGGTAAACTATGTACCGTTTGATGAGTTGCTGC 
4100 

* 

LysIleAlalleSerLeuArgPheMetCysArgSerlleArglleArgThrlleLeuSer 
Lys***ArgTyrArgTyrAlaSerCysAlaAlaGlnTyrGlyTyrAlaLeuTyrTyrGln 
AsnSerAspIleValThrLeuHisValProLeuAsnThrAspThrHisTyrllelleSer 
AAAATAGCGATATCGTTACGCTTCATGTGCCGCTCAATACGGATACGCACTATATTATCA 

4200 
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MaThr M n l ysTy rt r^ 1 u«.SerLy S Gl»Hi S rh«Le^rn.l*»GlyAl.V.l 
ProArgThrAsnThrGluAsnGluAlaArgSerHeSerryrSlnTyrTrpAUAr^er 

Bi S Glu Gl n 1 l.G l nArc,Me t Ly S Gln G lyAlaPheI.u I :e A sn T hr G lyAr g GlyPro 
GCCACGAACAAATACAGAGAATGAAGCAAGGAGCATTTCTTA7CAATACTGGGCGCGGTC 

HisLeu*-ileProMetSerTr P LeuLysHis*-LysThrC-ly A sn T rpAlaValPro 

ThrCysArgTyrLeu*" valGly-*SerIleArgLysArcGluThrGlyArgCys A rg 

LeuValAspThrTyrGluLeuValLysAlaLeuGluAsnGlyLysLeuGlyGlyAlaAla 
CACTTGTAGATACCTATGAGTTGGTTAAAGCATTAGAAAACG3GAAACTGGGCGGTGCCG 

4300 

HisTrpMetTyrTrpLysGluArgLysSerPheSerThrLeurieAlaProLysAsnGln 
HeGlyCysIleGlyArgArgGlyArgValPheLeuLeu-leuHisProLysThrAsn 
LeuAspValLeuGluGlyGluGluGluPhePheTyrSerAspCysThrGlnLysProIle 
CATTGGATGTATTGGAAGGAGAGGAAGAGTTTTTCTACTCTG-TGCACCCAAAAACCAA 

LeuIlelleAsnPheTyrLeuAsnPheLysGluCysLeuTtr-— SerHisArglle 
****** SerIlePheThr***ThrSerLysAsnAla***ArcA SP AsnHisThrAlaTyr 
AspAsnGlnPheLeuLeuLysLeuGlnArgMetProAsnValllelleThrProHisThr 
TTGATAATCAATTTTTACTTAAACTTCAAAGAATGCCTAACGTGATAATCACACCGCATA 

4400 • 

ArgProIlelleProSerLysArgCysVallleProLeuLyslysProLeuLysThrVal 
GlyLeuLeuTyrArgAlaSerValAla*-TyrArg-*LysAsnHi S -*LysLeuPhc 
AlaTyrTyrThrGluGlnAlaLeuArgAspThrValGluLvsThrlleLysAsnCysLeu 
CGGCCTATTATACCGAGCAAGCGTTGCGTGATACCGTTGAAAAAACCATTAAAAACTGTT 

4500 
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TrpIleLeuLysGlyAspArgSerMetAsnArglleLysValAlalleLeuPheGlyGly 
GlyPhe***LysGluThrGlyAla***IleGlu***LysLeuGlnTyrCysLeuGlyVal 
AspPheGluArgArgGlnGluHisGlu***AsnLysSerCysA S nThrValTrpGlyL 
TGGATTTTGAAAGGAGACAGGAGCATGAATAGAATAAAAGTTGCAATACTGTTTGGGGGT 



eu 



CysSerGluGluHisAspValSerValLysSerAlalleGluIleAlaAlaAsnlleAsn 
AlaGlnArgSerMetThrTyrArg***AsnLeuGln***Arg***ProLeuThrLeuIle 
LeuArgGlyAla***ArgIleGlyLyslleCysAs n ArgA S pSerArg***His-**- 

TGCTCAGAGGAGCATGACGTATCGGTAAAATGTGCAATAGAGATAGCCGCTAACATTAAT 

4600 

• • 

LysGluLysTyrGluProLeuTyrlleGlylleThrLysSerGlyValTrpLysMetCys 

LysLysAsnThrSerArgTyrThrLeuGluLeuArgAsnLeuValTyrGlyLysCysAla 

ArgLysIleArgAlaVallleHisTrpAsnTyrGluIleTrpCysMetGluAsnValArg 

AAAGAAAAATACGAGCCGTTATACATTGGAATTACGAAATCTGGTGTATGGAAAATGTGC 

•• • . . 

GluLysProCysAlaGluTrpGluAsnAspAsnCysTyrSerAlaValLeuSerProAsp 

LysAsnLeuAlaArgAsnGlyLysThrThrlleAlalleGlnLeuTyrSerArgArglle 

LysThrLeuArgGlyMetGlyLysArgGlnLeuLeuPheSerCysThrLeuAlaGly*- 

GAAAAACCTTGCGCGGAATGGGAAAACGACAATTGCTATTCAGCTGTACTCTCGCCGGAT 
4700 

• 

LysLysMetHisGlyLeuLeuValLysLysAsnHisGluTyrGluIleAsnHisValAsp 
LysLysCysThrAspTyrLeuLeuLysArgThrMetAsnMetLysSerThrMetLeuMet 
LysAsnAlaArgIleThrCys***LysGluPro***Ile***AsnGlnProCys***Cys 
AAAAAAATGCACGGATTACTTGTTAAAAAGAACCATGAATATGAAATCAACCATGTTGAT 

4800 
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ValAlaPheSerAlaLeuHisGlyLysSerGlyGluAspGli-SerlleGlnGlyLeuPhe 
***HisPheGlnLeuCy S MetAlaSerGlnValLy S MetAs??roTyrLysValCysLeu 
SerIlePheSerPheAlaTrpGlnValArg***ArgTrpUeHisThrArgSerVal 
GTAGCATTTTCAGCTTTGCATGGCAAGTCAGGTGAAGATGGATCCATACAAGGTCTGTTT 

GluLeuSerGlylleProPheValGlyCysAspIleGlnSerSerAlalleCysMetAsp 
AsnCysProValSerLeuLe«***AlaAlaIlePheLysAlaGlnGlnPheValTr P Thr 
IleValArgTyrProPheCysArgLeuArgTyrSerLysLeuSerAsnLeuTyrGlyGln 
GAATTGTCCGGTATCCCTTTTGTAGGCTGCGATATTCAAAGC7CAGCAATTTGTATGGAC 

4900 

LysSerLeuThrTyrlleValAlaLysAsnAlaGlylleAlarhrProAlaPheTrpVal 

AsnArg** *HisThrSerLeuArgLysMetLeuGly** *LeuLeuProProPheGlyLeu 
IleValAspIleHisArgCysGluLysCysTrpAspSerT-yrSerArgLeuLeuGlyTyr 
AAATCGTTGACATACATCGTTGCGAAAAATGCTGGGATAGCTACTCCCGCCTTTTGGGTT 

IleAsnLysAspAspArgProValAlaAlaThrPheThrTyrrroValPheValLysPro 
LeuIleLysMetlleGlyArgTrpGlnLeuArgLeuProIleLeuPheLeuLeuSerArg 
****** Ar g******AlaGlyGlySerTyrValTyrLeuSerCysPheCys***AlaGly 
ATTAATAAAGATGATAGGCCGGTGGCAGCTACGTTTACCTATCCTGTTTTTGTTAAGCCG 

5000 • 

AlaArgSerGlySerSerPheGlyValLysLysValAsnSerAlaAspGluLeuAspTyr 
Arg ValGlnAlaHisProSerVal***LysLysSerIleAlaArgThrAsnTrpThrThr 
AlaPheArgLeuIleLeuArgCysGluLysSerGln***ArgGlyArgIleGlyLeuArg 

GCGCGTTCAG 



IGGCTCATCCTTCGGTGTGAAAAAAGTCAATAGCGCGGACGAATTGGACTAC 



5100 
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AlalleGluSerAlaArgGlnTyrAspSerLysIleLeuIleGluGlnAlaValSerGly 
GlnLeuAsnArgGlnAspAsnMetThrAlaLysSer***LeuSerArgLeuPheArgAla 
Asn***IleGlyLysThrIle***GlnGlnAsnLeuAsn***AlaGlyCy 5 PheGlyLeu 
GCAATTGAATCGGCAAGACAATATGACAGCAAAATCTTAATTGAGCAGGCTGTTTCGGGC 
* 

CysGluValGlyCysAlaValLeuGlyAsnSerAlaAlaLeuValValGlyGluValAsp 
ValArgSerValValArgTyrTrpGluThrValProArg*^LeuLeuAlaArgTrpThr 
***GlyArgLeuCysGlyIleGlyLysGlnCysArgValSerCysTrpArgGlyGlyPro 
TGTGAGGTCGGTTGTGCGGTATTGGGAAACAGTGCCGCGTTAGTTGTTGGCGAGGTGGAC 

5200 

• 

GlnlleArgLeuGlnTyrGlyllePheArglleHisGlnGluValGluProGluLysGly 
LysSerGlyCysSerThrGluSerPheValPhelleArgLysSerSerArgLysLysAla 
AsnGlnAlaAlaValArgAsnLeuSerTyrSerSerGlySerArgAlaGlyLysArgL 
CAAATCAGGCTGCAGTACGGAATCTTTCGTATTCATCAGGAAGTCGAGCCGGAAAAAGGC 



eu 



SerGluAsnAlaVallleThrValProAlaAspLeuSerAlaGluGluArgGlyArglle 

LeuLysThrGl n Leu***ProPheProGlnThrPheGlnGlnArgSerGluAspGlyTyr 

***LysArgSerTyrAsnArgSerArgArgProPheSerArgGlyAlaArgThrAs P Thr 

TCTGAAAACGCAGTTATAACCGTTCCCGCAGACCTTTCAGCAGAGGAGCGAGGACGGATA 
5300 

GlnGluThrAlaLysLysIleTyrLysAlaLeuGlyCysArgGlyLeuAlaArgValAsp 
ArgLysArgGlnLysLysTyrIleLysArgSerAlaValGl U Val***ProValTrpIle 
GlyAsnGlyLysL yS AsnIle***SerAlaArgLeu***ArgSerSerProCysGlyTyr 
CAGGAAACGGCAAAAAAAATATATAAAGCGCTCGGCTGTAGAGGTCTAGCCCGTGTGGAT 



5400 
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H etPneLeu G ln A s P As„ G lyAx,Ilva l I.eu AS nGluVaU S nThrLeuProG 1 yPhe 
CysPheTyrLysIleThrAlaAiaLeuTyr-.ThrLysSerlleLeuCysProValSer 

valPheIhrAr 3 ».Ar,Pr=HisCyaThrGluXxgSer G i n IyrSerA 1 aAr 9 PheHi S 
ATGTTTTTACAAGATAACGGCCGCATTGTACTGAACGAAGTCAATACTCTGCCCGGTTTC 

IbrS .rTyrS.rArgTyrP t =Ar 9 «at».tAlaAlaAl.G 1 yIleAl.LeuPr=GluLeu 
ArjHisThrValVallleProVal—TrpProLeuGlnVaiLeuHisPheProAsn... 

ValIl«Gln S erL.uS.rPr=TyrA. P GXyAr 9 CyaArgTyrCy»Thr S erAr,ThrAsp 
ACGTCATACAGTCGTTATCCCCGTATGATGGCCGCTGCAGGTATTGCACTTCCCGAACTG 

5500 

HeAspArgLauIlaVaHeuAlaLeuLyaGly""" AiaTrpLys-AspLauLeu 
leuI1 ,rAla—SerTyr—Arg.«Ar g GlyA.pLy.HisGlyA.nArg I leTyrPhe 
..- Pr0 LauA,pArg I l.SerVa l Ly.GlyVaine S erKa t GluIleGlyP«aTnrPha 

ATTGACCGCTTGA! 



iTCGTATTAGCGTTAAAGGGGTGATAAGCATSGAAATAGGATTTACTT 



Phe ...MetI.ys."TyrThrValPh«ValGlyThrLeuAsnKatProLeuGlyIleIl= 
PheArg—AsnSerThrArgCyaEarLeuGlyArg—IleCysHisLauGiy—Phe 
leuAapGl^leValHisGlyValArgTrpAspAlaLysTyrAlaThrTtpAspAsnPhe 

TTTTAGATGAAATAGTACACGGTGTTCGTTGGGACGCTAAATATGCCACTTGGGATAATT 

5600 • 

S.rProGluAanArgL.uThrVaaH.tl.ya—Il^laL.a— GlyBi.ThrS.rTrp 
SiaArgX-ysThrGly— ArgLeu-.'Sari-ysSarHiaCysArgAspIleArgValGly 

ThrGlyLysProValAspGiyTyrGluVaiAsnArgllaVaiGiyThrTyrGluLeuAla 
TCACCGGAAAACCGGTTGACGGTTATGAAGTAAATCGCATTGTAGGGACATACGAGTTGG 

5700 
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LeuAsnArgPhe***ArgGlnLysAsnTrpLeuLeuProLysGlyThrAspCysPheTyr 
***IleAlaPheGluGlyLysArgThrGlyCysTyrProAxgValArgIleAlaSerMet 
GluSerLeuLeuL y sAlaL ysGluLeuAlaAlaThrGlnGlyTyrGlyLeuLeuLeuTrp 
^ CTGAATCGCTTTTGAAGGCAAAAGAACTGGCTGCTACCCAAGGGTACGGATTGCTTCTAT 

* 

GlyThrValThrValLeuSerValLeu***ThrValLeuCysAsnGlyLeuHisSerArg 

GlyArgLeuProSer***AlaCysCysLysLeuPheTyrAla.MetGlyCysThrAlaGly 

AspGlyTyrArgProLysArgAlaValAsnCysPheMetGlnTrpAlaAlaGlnProGlu 

GGGACGGTTACCGTCCTAAGC6TGCT6TAAACTGTTTTATGCAATGGGCTGCACAGCCGG 

5800 

Ly S IleThr"*GlnArgLysValIleIleProIleLeuThrGluLeuArg***PheGln 
Lys***ProAspLysGlyLy S LeuLeuSerGlnTyr***ProAsn***AspAspPheLy S 
AsnAsnLeuThrLysGluSerTyrTyrProAsnlleAspArgThrGluMetlleSerLys 
AAAATAACCTGACAAAGGAAAGTTATTATCCCAATATTGACCGAACTGAGATGATTTCAA 

LysAspThrTrpLeuGlnAsnGlnAlalleAlaAlaAlaValrroLeuIleLeuArgPhe 

ArgIleArgGlyPheLysIleLysPro***ProArgGlnCysflis*»*SerTyrAlaLeu 

GlyTyrValAlaSerLysSerSerHisSerArgGlySerAlalleAspLeuThrLeuTyr 

AAGGATACGTGGCTTCAAAATCAAGCCATAGCCGCGGCAGTGCCATTGATCTTACGCTTT 

5900 

• 

IleAsp***ThrArgValSerLeuT y rGlnTxpGlyAlaAspLeuIleLeuTr P MetAsn 
SerIleArgHisGly***AlaCysThrAsnGlyGluProIle***PheTyrGly***Thr 
ArgLeuAspThrG1 y GluLeuVa lProMetGlySerArgPheAspPheMetAspGluArg 
ATCGATTAGACACGGGTGAGCTTGTACCAATGGGGAGCCGAT7TGATTTTATGGATGAAC 

6000 

Fig. 5 (20/25) 
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AlaL . uI i eM et« g o ln M.t G luIyrHi3 M a M . tJ .ysAr S ,y S IleAlaAspV,lCy, 
l euSe r serCy SG lyLy S Trp R s„»eMet G ln...S e r Wil ysSerGlnThrPhe R la 

SerHisHisAXaAlaAsnGXyXleSarCyaAsnGluAXaGlnAsnArgArgArgLeuAr, 
GCTCTCATCATGCGGCAAATGGAATATCATGCAATGAAGCGCAAAATCGCAGACGTTTGC 

• 

WaPt oS«rrpI.yaThrV. 1G lyL.u I .ysBisIleAl.SarAsnGlyGlyThrM.tTyr 
l euHiaH i sG 1 y,ysG 1 nT rP Val.-.SarX l e-.ProA^etVa 1 A 1 a,euCya I la 

SernaMetGXuAsaSerGiyPheGluAlaTyrSerLeuGiuTrpTrpHisTyrValLeu 
GCTCCATCATGGAAAACAGTGGGTTTGAAGCATATAGCCTCGnATGGTGGCACTATGTAT 

6100 

... G1 uThrA»nHi S ThrPro I l.Al.IleL.u I l«SerPrc-.= U AanLy S L e uL.uThr 
Lys « g Ar,T h rIlaProGXn... t .»P h e...P h eProA.-,... I1 aAs„Ph.».Pro 

Arg AspGluProTyrPrcAsnSerTyrPh.AspPheProVal,ys...ThrPheAsnA I3 
TAAGAGACGAACCATACCCCAATAGCTATTTTGATTTCCCCSTTAAATAAACTTTTAACC 



valAlaArgThrAanTynleSer— leuPheArgGlnGL-hrA^ArgMef 
' Leu „is G lyGlnThrU..«A 1 aA=nS.rPheGlyAr,LyaProAspValCy3As n T r p 
CysThrAspLysL=aTyrLy S Le»ThrL.uSerAXaGlyA ! aPr=T S rTyrValT» 1 rG 1 y 

GTTGCACGGACAAACTATATAAGCTAACTCTTTCGGCAGGAARCCCGACGTATGTAACTG 

6200 • 

valLeuAr g Gl»Phe I leTyrSerAr 9 -»Tyr...Ar g cysL,aA 1 aG 1 u« gT yrCya 
P^GlyAsnLeuTyrXXaValAspSarlXeGluAspVa^GlnSarAspIleAla 
Ser ...Gly«.Iyrne««"Il.V»lI.eu 1 ya»et-GlyAr 9 Al.Il."«Ar g 

GTTCTTAGGGAATTTATATATAGTAGATAGTATTGAAGATGT«AGGCAGAGCGATATTGC 

6300 



Fig. 5 (21/25) 
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GlyHisTyrLeuArgAlaLeuArgGlnAspSerLeuIleIleArgLeuIleAla***Arg 
ValIleIleCysValArgCysGlyLysIleAla****.**.. Asp *** SerHisArgGly 

SerLeuSerAlaCysAlaAlaAlaArg***ProAspAsnLy S ThrAspArgIleGluGl y 
GGTCATTATCTGCGTGCGCTGCGGCAAGATAGCCTGATAATAAGACTGATCGCATAGAGG 
* 

GiyGlylleSerHisArgProLeuSerThrGlySerSerAlaSerLeuAsnSerAlaTrp 

ValValPheHisThrAlaHisCysGlnGlnAlaValGlnPrcArg***iieGlnHisGly 

TrpTyrPheThrProProIleValAsnArgGlnPheSerLeuValLysPheSerMetGly 

GGTGGTATTTCACACCGCCCATTGTCAACAGGCAGTTCAGCCICGTTAAATTCAGCATGG 

6400 

• ■ 

ValSerLeuMetLyslleHisLeuHisTrp*****" *****IleGln***GlyGluIle 
TyrHisLeu—LysPhelleTyrlleGlyAspAsnSerLysSerSerArgAlaLys— 
IleThrTyrGluAsnSerSerThrLeuValllelleValAsnProValGlyArgAsnAsn 
GTATCACTTATGAAAATTCATCTACATTGGTGATAATAGTAAATCCAGTAGGGCGAAATA 
* 

IleAspCysAsnLeuArgGlyLysThrAlaGlnSerGlnThrArgLeuCysArgLeuArg 

LeuThrValIleTyrGlyAlaLy S ArgHi S AsnL e uLysAxgAs P Cy S AlaVal***Gly 

***Leu***PheThrGlyGlnAsnGlyThrIleSerAsi,GluIieValProPheLysGl y 

ATTGACTGTAATTTACGGGGCAAAACGGCACAATCTCAAACGAGATTGTGCCGTTTAAGG 

6500 

GlyArgPhe-*Ly S TyrPheIleLeuProThrIle***LeuArgArgArgLeuLysMet 
GluAspSerArgAsnl leSerTyrPheGlnLeuTyrSer * * *GlyGlyAsp* * *Lys * ** 

LysIleLeuGluIlePheHisThrSerAsnTyrlleValLysGluGluThrGluAsnGlu 
GGAAGATTCTAGAAATATTTCATACTTCCAACTATATAGTTAnGGAGGAGACTGAAAATG 

6600 



Fig. 5 (22/25) 
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LysLysLeuPhePheLeuLeuL uLeuLeuPheLeuIleTyrLeuGlyTyrAspTyrVal 
ArgSerCysPhePheTyrCysTyrCysTyrSer-^TyrThr^ValMetThrThrLeu 
GluValValPhePheIleValIleValIleLeuAsnIlcLeuArgLeu*«LeuArg*** 
AAGAAGTTGTTTTTTTTATTGTTATTGTTATTCTTAATATACTTAGGTTATGACTACGTT 

AsnGluAlaLeuPheSerGlnGluLysValGluPheGlnAsnTyrAspGlnAsnProLys 
MetLysHisCysPheLeuArgLysLysSerAsnPheLysIleMetlleLysIleProLys 

***SerThrValPheSerGlyLysSerArgIleSerLysLeu*-SerLysSerGlnArg 
AATGAAGCACTGTTTTCTCAGGAAAAAGTCGAATTTCAAAA7TATGATCAAAATCCCAAA 

6700 

GluHisLeuGluAsnSerGlyThrSerGluAsnThrGlnGluLysThrlleThrGluGlu 
Asnlle—LysIleValGlyLeuLeuLysIleProLysArcLysGlnLeuGlnLysAsn 

Th rPheArgLys"*TrpAs P Phe***LysTyrProArgGl«AsnAsnTyrArgArgThr 
6AACATTTAGAAAATAGTGGGACTTCTGAAAATACCCAAGAGAAAACAATTACAGAAGAA 



GlnVa 



ITyrGlnGlyAsnLeuLeuLeuIleAsnSerLysTyrProValArgGlnGluVal 
ArgPheIleLysGluIleCysTyr*-SerIleValAsnIleLeuPheAlaLysLy S Cys 

GlyLeuSerArgLysSerAlalleAsnGln— HeSerCysSerProArgSerVal 
CAGGTTTATCAAGGAAATCTGCTATTAATCAATAGTAAATATCCTGTTCGCCAAGAAGTG 

6800 • 

***SerGlnIleSer*-IleTyrLeuAsnMetThrAsn— MetAspThrGlyCys 
GluValArgTyrArgGluPheIle***Thr*-ArgIleAsnLysTrpIleArgValAla 
LysSerAspIleValAsnLeuSerLysHisAspGluLeuIleAsnGlyTyrGlyLeuLeu 
TGAAGTCAGATATCGTGAATTTATCTAAACATGACGAATTAATAAATGGATACGGGTTGC 

6900 
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LeuIleValIlePheIleCysGlnLysLys***HisLysAsr.?heGlnArgTrpSerMet 
******** *TyrLeuTyrValLysArgAsnSerThrLys IiePheArgAspGlyGln * * * 
* As P SerAsn IieTyrMetSerLysGluIleAlaGlnLys?heSerGluMetValAsnAsp 
TTGATAGTAATATTTATATGTCAAAAGAAATAGCACAAAAATrTTCAGAGATGGTCAATG 
* 

MetLeu***ArgValAlaLeuValIleLeuLeuLeuIleValAlaIleGluThrLeuMet 
CysCysLysGlyTrpArg***SerPheTyrTyr******TrpLeuSerArgLeu****** 
AlaValLysGlyGlyValSerHisPhellelleAsnSerGlyTyrArgAspPheAspGlu 

ATGCTGTAAAGGGTGGCGTTAGTCATTTTATTATTAATAGTG3CTATCGAGACTTTGATG 

7000 

* • 

SerLysValCysPheThrLysLysTrpGlyLeuSerMetPrcTyrGlnGlnVallleVal 
AlaLysCysAlaLeuProArgAsnGlyGly * * * ValCysLe -ThrSerArgLeu* * * * * * 

GlnSerValLeuTyrGlnGluMetGlyAlaGluTyrAlaleuProAlaGlyTyrSerGlu 
AGCAAAGTGTGCTTTACCAAGAAATGGGGGCTGAGTATGCCrrACCAGCAGGTTATAGTG 

Ser I le I leGlnValTy rHi s * * *Met * * * AspGlnAla * * - ArgLy sTrpAsnGluPro 
Ala***PheArgPheIleThrArgCysArgIleLysLeuAs?GluAsnGlyThrSerPro 
HisAsnSerGlyLeuSerLeuAspValGlySerSerLeuThrLysMetGluArgAlaPro 

AGCATAATTCAGGTTTATCACTAGATGTAGGATCAAGCTTGACGAAAATGGAACGAGCCC 

7100 . 

LeuLysGluSerGly***LysLysMetLeuGlyAsnThrGlySerPheTyrValIleGln 
***ArgLysValAspArgArgLysCysLeuGluIleArgVa:HisPheThrLeuSerArg 
% GluG1 y L y sTr P IleG1 «GluAsnAlaTrpLysTyrGlyPheIleLeuArgTyrProGlu 
CTGAAGGAAAGTGGATAGAAGAAAATGCTTGGAAATACGGGTrCATTTTACGTTATCCAG 

7200 

Fi_g._5 (24/25) 
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ArgThrLy sGlnSer* * *GlnGluPhe 
GlyGlnAsnArgValAsnArgAsnSer 
AspLysThrGluLeuThrGlylleGln 
AGGACAAAACAGAGTTAACAGGAATTC 

7227 
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